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摘 
等 语言 学 线索 帮助 词 切 分 , 而 首 、 尾 词素 位 置 概率 的 


要 中文 词 切 分 的 认 知 机 制 一 直 是 心理 语言 学 关注 的 焦点 


问题 之 一 ， 研 究 发 现 中 文 读者 可 使 用 


词素 位 置 概率 


要 程度 以 往 研 究 观 点 并 不 一 致 。 本 研究 通过 词汇 判断 和 腿 


动 实验 ,考察 中 文 读 者 对 首 、 尾 词素 位 置 概率 的 利用 情况 。 实 验 1a 和 lb 采 
向 。 在 错误 率 和 反应 时 指标 上 , 高 频 词 条 件 下 词 首 


下 词 首 与 词尾 词素 位 置 概率 对 词汇 识别 的 影 


用 词汇 判断 任务 , 考察 在 不 同 词 频 条 件 
与 词尾 词素 位 置 概 


率 效应 不 显著 ; 低频 词 条 件 下 词 首 词素 位 置 概率 效应 显著 , 词尾 词素 位 置 概 率 效应 不 显著 ,实验 2a 和 2b 采用 句子 


a 


阅读 任务 , 考察 在 


自然 阅读 情境 中 被 试 对 词素 位 置 概 率 的 运 


j。 在 凝视 时 间 、 


回 视 路 径 时 间 和 总 注视 时 间 指 标 上 ， 


低频 词 条 件 下 词 首 词素 位 置 概率 效应 显 


敬 ， 词 尾 词素 位 置 概率 效应 不 显著 。 高 频 词 条 件 下 词 首 与 词尾 词素 位 置 概 


率 效 应 均 不 显著 。 词 汇 判 断 和 了 眼 动 证 据 共同 表明 , 词素 位 置 概率 信息 是 中 文 读者 重要 的 语言 词 切 分 线索 , 且 与 词尾 


词素 位 置 概 率 相 比 , 词 首 词素 位 置 概率 在 词汇 切 分 与 识 


别 


过 程 中 发 挥 的 作 


TEK, 同时, 词素 位 置 概 率 线索 的 运用 


会 受到 词 频 的 影响 , 研究 结果 支持 复合 词 加 工 的 混合 通达 表征 模型 。 


关键 词 ” 词 切 分 , 词素 位 置 概率 ， 中 文 阅读 ， 眼 动 
分 类 号 B842 


1 引言 


阅读 过 程 中 读者 对 词素 位 置信 息 的 加 工 是 词 
汇 识别 不 可 或 缺 的 步骤 ,一 般 而 言 , 词汇 识别 包含 
两 类 编码 ， 即 身份 信息 编码 和 位 置信 息 编 码 。 身 份 
言 息 编码 是 指 哪些 字符 构成 了 词汇 ,而 位 置信 息 编 
人 码 是 指 字 符 在 词汇 中 的 相对 顺序 ( 滑 芒 敏 等 ， 
2017)。 字 符 的 位 置信 息 在 词汇 识别 中 有 重要 作用 ， 
英文 中 读者 区 分 相同 字母 组 成 的 单词 时 便 依据 字 
母 的 位 置 差 异 ， 如 causal 和 casual。 同 样 ， 中 文 读 
者 也 由 词素 位 置信 息 识 别 变 位 词 ， 辟 如“ 上海 "和 
“海上 ” 二 者 身份 信息 相同 ,通过 词素 位 置 区 分 语 
义 。 若 词素 位 置 判断 能 力 不 足 则 会 干扰 正常 阅读 ， 
一 部 分 阅读 障碍 儿童 对 汉字 位 置 出 现 判 断 困 难 ， 测 
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试 成绩 显著 低 于 控制 组 儿童 ( 田 晓 梅 等 , 2006)。 词 
素 位 置信 息 的 加 工 是 通 往 词 汇 识 别 和 更 高 语言 水 
平 加 工 的 重要 途径 ， 离 不 开 视 觉 和 认 知 加 工 系统 的 
相互 作用 。 据 此 , 研究 者 对 拼音 文字 的 字母 位 置信 
息 进行 了 深入 探究 ， 发现 了 字母 的 换 位 效应 
(transposition-letter effect, TL effect)， 即 人 们 在 阅 
读 一 个 内 有 字母 换 位 的 非 词 时 ， 倾 向 于 将 其 识别 为 
与 之 对 应 的 真 词 ， 并且 这 种 倾向 比 将 内 有 蔡 换 字母 
的 非 词 当 作 真 词 的 概率 要 高 (Perea & Carreiras, 
2006). 后 续 人 研究 更 进一步 , 探究 了 词 首 与 词尾 位 置 
之 于 词汇 识别 的 重要 程度 , 研究 认为 比 起 词 内 部 的 
换 位 ,发 生 在 词 首 、 词 尾 的 换 位 会 对 词汇 识别 起 到 
更 大 的 破坏 作用 (Yakup et al., 2014)。Schotter 等 人 
(2012) 发 现 词 首 的 字母 或 者 词 首 的 字 更 重要 。 综 上 


目 (2019YJSB128)。 
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所 述 , 词素 位 置信 息 的 加 工 是 词汇 识别 的 重要 环节 ， 
且 词 素 处 于 不 同 的 位 置 对 词汇 识别 所 起 的 作用 不 
同 。 对 词素 位 置 与 整 词 词汇 识别 关系 的 深入 思考 ， 
将 有 助 于 我 们 认识 汉字 水 平 自 下 而 上 的 加 工 对 词 
切 分 及 阅读 认 知 机 制 的 理解 。 

中 文 阅读 同样 重视 词素 位 置 的 作用 ,也 发 现 了 
字母 转 置 效 应 (Gu et al., 2015)， 且 发 现 词 边界 信息 
影响 汉字 位 置 的 加 工 ( 顾 俊 娟 等 , 2020). MHR AS 
人 (1999) 发 现 词素 换 位 也 能 达到 正常 语义 启动 的 效 
R, 卞 迁 等 人 (2010) 应 用 眼 动 技术 探究 词素 换 位 对 
词素 识别 的 影响 ， 发 现 含 高 频 词 素 换 位 的 词汇 识别 
要 快 于 低频 词素 换 位 的 词汇 。 需 指出 的 是 ， 中文 的 
字 序 编码 区 别 于 位 置 编码 ,字形 编码 发 生 在 阅读 的 
早期 阶段 ， 而 位 置信 息 的 编码 则 具有 一 定 灵 活性 
(Gu et al., 2015). R X& IE E (2018) FUB 3 
3X, HE Y AS UB SERI P ETE ERR] e rE 
词 的 启动 条 件 ， 发 现 首 字 替 换 词 对 目标 词 的 启动 效 
果 最 小 , 说 明 首 字 的 替换 对 词汇 识别 的 破坏 性 更 大 ， 
证 实 了 词 首 在 词汇 加 工 中 的 重要 性 。 总 体 来 看 ， 词 
素 位 置信 息 的 加 工 是 词汇 加 工 的 重要 环节 ， 且 值得 
思考 的 是 , 词素 的 特定 位 置 (如 词 首 ) 能 影响 词汇 加 
TL, 那么 词素 位 置 概率 又 是 怎样 作用 于 词汇 识别 的 
WE? 具体 而 言 ， 词 素 位 置 概率 指 的 是 汉字 出 现在 词 
首 或 词尾 时 双 字 词 的 次 数 占 该 汉字 组 成 的 所 有 双 
字 词 (无 论 出 现在 首 字 还 是 尾 字 ) 的 比重 (Yen et al., 
2012)。 例 如 ,在 语料库 中 “ 消 ? 可 组 成 39 个 双 字 词 ， 
其 出 现在 词 首 可 组 成 33 个 词 ， 如 “消炎 ”、“ 消 息 ”、 
“消失 ”等 ,为 此 ， 其 词 首 词素 位 置 概率 为 0.85。 可 
见 ,“ 消 ”* 常 居于 双 字 词 词 首 , 这 为 读者 提供 了 较 清 
晰 的 词 边界 信息 。 连 坤 予 等 人 (2021) 发 现 被 试 在 低 
词素 位 置 概率 条 件 下 的 凝视 时 间 显 著 长 于 高 概率 
条 件 ， 表现 出 明显 的 词素 位 置 概率 效应 。 而 且 读 者 
对 词素 位 置 概率 的 利用 表现 出 发 展 上 的 差异 性 ， 即 
大 学 生 运 用 词素 位 置 概率 帮助 词 切 分 的 能 力 强 于 
小 学 生 (Liang et al., 2015). 

词素 位 置 概率 现象 是 中 文 词汇 的 显著 特点 ,中 
文 以 汉字 为 书写 单元 , 汉字 携带 一 定 意义 且 是 汉语 


者 提供 了 词 与 词 之 间 隐 含 的 边界 ,为 中 文 词汇 的 切 
分 提供 了 可 用 线索 。 因 为 中 文 词汇 的 识别 与 切 分 区 
别 于 拼音 文字 ， 拼音 文 字 中 的 空格 为 读者 提供 了 明 
确 的 单词 首尾 部 分 的 物理 空间 边界 信息 ,帮助 计划 
下 一 次 眼 跳 ,促进 单词 的 识别 (Perea & Acha, 2009; 
Rayner，1998)。 而 中 文 无 词 间 空 格 标示 词 边界 ， 邻 
近 的 汉字 可 组 成 双 字 词 、 三 字 词 及 四 字 词 , 并 且 中 
文 组 词 的 模糊 性 也 加 大 了 词 切 分 难度 (Gao et al., 
2005), 但 中 文 读者 并 未 遭遇 特殊 阅读 困难 ， 其 阅 
读 速 度 可 与 拼音 文字 读者 保持 一 致 (Liversedge et al., 
2016), 那么 中 文 读者 如 何 进 行 词 切 分 就 成 为 汉语 
阅读 的 一 个 独特 问题 ， 其 必定 借助 某 些 隐 含 线索 协 
助词 切 分 。 此 时 ， 词 素 位 置 概率 信息 可 作为 一 种 隐 
含 的 语言 线索 帮助 词 切 分 ,由 于 词素 经 常 出 现在 双 
字 词 的 某 一 特定 位 置 ( 词 首 或 词尾 ), 一 定 程度 上 标 
示 出 了 词 与 词 之 间 的 隐藏 边界 ， 据 此 ， 研 究 者 们 开 
展 了 一 系列 研究 。 深 菲菲 (2013) 用 新 词 习 得 的 方式 
探讨 了 中 文 读者 对 词素 位 置 概率 线索 的 使 用 , 研究 
操纵 首 、 尾 词素 的 位 置 概率 , 创设 三 种 类 型 的 假 词 
作为 新 闻 ， 发 现在 词素 位 置 概率 一 致 条 件 下 的 注视 
时 间 和 注视 次 数 显 著 低 于 不 一 致 条 件 。Yen 等 人 
(2012) 采 用 边界 范式 的 研究 表明 ， 中文 读 者 能 够 利 
用 词尾 词素 位 置 概率 指导 词汇 识别 和 眼 跳 控制 。 高 
湛 (2018) 以 儿童 和 成 人 为 研究 对 象 ， 对 词 首 、 尾 词 
素 位 置 概 率 的 关系 进行 了 推论 ， 即 词 首 词 素 位 置 概 
率 的 高 低 对 儿童 和 成 人 的 阅读 行为 没有 影响 , 但 词 
尾 词素 位 置 概率 显著 影响 了 儿童 和 成 人 的 阅读 表 
现 , 研究 结果 进一步 肯定 了 词尾 词素 位 置 概率 的 词 
切 分 作用 。 然而 一 项 后 续 人 研究 提供 了 不 同 的 实验 证 
据 ， 即 儿童 和 成 人 均 能 利用 词 首 和 词尾 词素 位 置 概 
率 指导 阅读 活动 ( 连 坤 予 等 , 2021)。 可 见 ， 词 首 与 
词尾 词素 位 置 概率 在 阅读 过 程 中 的 作用 还 未 取得 
较为 统一 的 观点 ， 是 词尾 词素 位 置 概率 发 挥 了 主要 
作用 , 还 是 词 首 与 词尾 同等 重要 ? 这 一 问题 的 解决 
有 待 开 展 后 续 人 研究 深入 考察 与 港 清 。 

值得 一 提 的 是 ， 有 研究 指出 低频 词 倾向 于 词素 


最 小 的 语言 单位 ， 而 词素 是 指 具 有 独立 形态 和 意义 
的 最 小 语言 单位 ( 张 玲 燕 等 ， 2013)， 同 时 ， 汉 语 书 
写 系统 中 大 多 数 词 是 双 字 词 ， 词 素 位 置信 息 相 对 明 
确 ( 赵 思 敏 等 ,2017)。 据 统计 , 约 20% 的 汉字 出 现 
在 多 字 词 的 固定 位 置 ， 其 中 8.2% 惯 常 居于 词 首 ， 


通达 ， 而 高 频 词 可 能 经 由 整 词 路 径 通 达 ( 高 淇 ， 
2018)。 换言之 , 在 心理 词典 中 低频 词 倾 向 于 以 单个 
字 的 形式 进行 表征 ， 而 高 频 词 常 以 整体 形式 表征 
( 白 学 军 等 ,2015)。 事 实 上 ,中 文 复 合 词 的 表征 方 
式 一 直 存 有 争议 , 在 识别 复合 词 时 ， 是 通过 整 词 表 
征 亦 或 经 由 分 解 的 词素 表征 ,以 及 二 者 发 挥 作用 的 


7.5% 惯 常 居于 词尾 ，2.1% 以 单字 词 形式 呈现 ( 白 学 
7E, BEA, 2017), 词素 位 置 的 这 一 特性 为 中 文 读 


程度 如 何 , 一直 是 心理 语言 学 研究 的 热点 问题 。 研 
究 者 基于 不 同 的 研究 材料 、 范 式 及 技术 手段 给 予 了 


ChinaXiv 合 作 期 刊 


第 2 期 曹 海 波 等 : 词素 位 置 概率 在 中 文 阅读 中 的 作用 : 词汇 判断 和 眼 动 研 究 161 


不 同 程度 的 回答 ,既往 研究 证 据 提 示 词 频 会 影响 词 
汇 加 工 ， 高 频 词 的 注视 时 间 显 著 低 于 低频 词 (Wei et al., 
2013)， 从 高 频 中 央 止 词 到 副 中 央 止 词 的 眼 跳 长 度 
显著 长 于 从 低频 词 跳 出 的 眼 跳 长 度 ( 王 永 胜 等 ， 
2018)， 对 不 同 词 频 的 使 用 会 影响 真 词 与 换 位 假 词 
的 判断 (Vergara-Martinez et aL, 2013)。 相 关 研 究 指 
出 词素 特征 是 词汇 识别 的 重要 影响 因素 , 并 且 在 低 
频 词 加工 中 表现 的 更 加 明显 ( 芝 聘 龄 等 , 1999)。 与 
词素 位 置 颠 倒 的 高 频 词 相 比 ， 读 者 对 词素 位 置 颠倒 
的 低频 词 识别 较 慢 ( 卞 迁 等 , 2010)。 可 见 , 整 词 的 
词 频 对 词汇 的 加 工具 有 潜在 影响 。 

研究 者 还 关注 到 , 在 中 文 的 词汇 识别 过 程 中 ， 
首 词素 与 尾 词素 对 整 词 识别 的 贡献 不 同 ， 且 词 频 的 
变化 会 带 来 阅读 行为 的 改变 ,这 使 得 词 频 对 词素 位 
置 概率 线索 的 作用 成 为 一 个 新 间 题 。 不 同 词 频 条 件 
下 词素 位 置 概率 还 能 否 发 挥 作 用 , 词 首 与 词尾 词素 
位 置 概率 的 作用 差异 如 何 ? 探查 既往 研究 发 现 其 
未 对 词 频 做 出 具体 区 分 ， 这 是 否 成 为 词 首 与 词尾 词 
素 位 置 概率 作用 不 同 的 潜在 影响 因素 ? 另外, 根据 
经 典 的 词汇 识别 模型 如 McClelland 和 Rumelhart 
(1981) 的 交互 激活 模型 、Davis (2001) 的 自我 组 织 词 
汇 习 得 与 识别 模型 、Taft(2004) 的 多 层 激活 模型 ， 词 
频 是 进入 词汇 通达 的 重要 因素 ,其 可 能 会 影响 到 汉 
语词 素 位 置 概率 对 词汇 识别 的 加 工 呈 现 出 不 同 的 
模式 。Li 和 Pollatsek (2020) 提 出 的 中 文 阅读 的 整合 
模型 也 指出 词 频 是 影响 词汇 识别 的 重要 因素 ， 词 频 
直接 影响 词汇 节点 的 输入 ， 并 成 功 预测 了 词 频 对 了 眼 
跳 长 度 的 影响 。 鉴 于 此 ， 有 必要 在 探究 首 、 尾 词素 
位 置 概率 认 知 机 制 的 基础 上 ， 进 一 步 明 确 整 词 词 频 
的 内 在 影响 ,探究 中 文 复合 词 的 加 工 方式 ， 即 复合 
词 的 表征 究竟 是 基于 词素 、 整 词 ， 亦 或 是 混合 通 
ik? 据 此 ， 对 上 述 问题 的 考察 便 体现 出 一 定 的 新 意 
和 价值 。 第 一 ， 对 复合 词 认 知 加 工 的 组 件 词素 作用 
的 研究 ， 可 加 深 对 复合 词 通达 表征 网 络 的 理解 。 第 
二 ， 当 前 汉语 词素 位 置信 息 加 工 机 制 的 研究 尚 浅 ， 
持续 探讨 词素 位 置 概率 之 于 词 切 分 的 作用 ， 有 助 于 
回答 中 文 读者 如 何 确定 词 边界 的 问题 , 为 仍 处 于 探 
索 中 的 汉字 位 置 编 码 机 制 提供 新 视角 。 

研究 设计 了 4 个 实验 , 实验 la 和 lb 采用 词汇 
判断 任务 ,创设 不 同 的 首 、 尾 词素 位 置 概率 条 件 ， 
同时 操纵 目标 词 词 频 。 另 外 ,由 于 汉语 中 高 IK 
词汇 难以 平衡 词 首 和 词尾 的 词素 位 置 概率 ， 故 未 采 
用 2 ( 词 频 : 高 、 低 ) x 2( 词 首 词素 位 置 概率 : 高 、 
低 ) x 2( 词 尾 词 素 位 置 概率 : 高 、 低 ) 的 实验 设计 ， 而 


是 采用 2( 词 首 词素 位 置 概率 : 高 、 低 ) x 2 (词尾 词 
素 位 置 概率 : 高 、 低 ) 的 两 因素 被 试 内 重复 测量 实验 
设计 ， 分 开 考察 词 频 因素 的 影响 便于 更 清晰 地 考察 
不 同 词 频 条 件 下 词素 位 置 概率 的 重要 程度 。 词 素 位 
置信 息 的 加 工 是 词汇 加 工 的 重要 阶段 ， 词 首 与 词尾 
在 词汇 识别 过 程 中 发 挥 着 不 同 作 用 ， 词 首 作用 较为 
积极 ， 研 究 假 设 : 词素 位 置 概率 信息 是 中 文 词汇 识 
别 的 语言 线索 ,， 且 与 词尾 词素 位 置 概率 相 比 , 词 首 
词素 位 置 概率 在 词汇 识别 中 的 促进 作用 更 大 。 实验 
2a 和 2b 采用 句子 阅读 任务 , 记录 被 试 在 句子 阅读 
过 程 中 的 眼 动 特征 ,进一步 考察 处 于 生态 效 度 更 高 
的 自然 阅读 情景 下 词素 位 置 概率 效应 是 否 存在 ， 以 
及 作用 发 挥 在 加 工 的 哪 一 阶段 。 研 究 假设 : 读者 能 
利用 词素 位 置 概率 线索 帮助 词 切 分 , 词 首 词素 位 置 
概率 的 优势 更 为 明显 ,同时 词 频 会 影响 这 一 作用 的 
发 挥 ， 即 低频 词 条 件 下 读者 能 够 运用 词素 位 置 概率 
线索 助力 词 切 分 , 高 频 词 条 件 下 这 种 促进 作用 会 减 
弱 。 依据 Li 等 人 (2009) 提 出 的 词 切 分 与 词汇 识别 模 
型 ， 中 文 词 汇 识别 是 一 个 交互 激活 的 过 程 ， 字 水 平 
的 激活 前 锁 到 词 水 平 ， 反 过 来 词 单元 的 激活 也 反馈 
到 组 成 该 词 的 字 水 平 。 字 词 层面 的 信息 交互 激活 并 
相互 影响 ， 属 于 该 词 的 字 比 其 它 字 激 活 更 快 ， 同 时 
属于 该 字 的 位 置 比 其 它 字 的 位 置 激活 更 快 。 如 果 在 
高 频 词 中 未 发 现 词素 位 置 概率 效应 ， 说 明 词 汇 识别 
是 经 由 整 词 表征 的 , 输入 刺激 直接 激活 了 心理 词典 
的 整 词 词 条 。 如 果 在 低频 词 中 观察 到 词素 位 置 概 率 
效应 ， 则 表明 词汇 识别 过 程 中 发 生 了 分 解 的 词素 表 
征 ,词素 激活 后 影响 到 整 词 识别 。 鉴 于 此 , 复合 词 
的 加 工 既 存在 整 词 表征 又 存在 词素 表征 ,人 研究 结果 
倾向 于 支持 复合 词 加 工 的 混合 通达 表征 观点 。 


2 实验 la: 词素 位 置 概率 在 高 频 词 
词汇 识别 中 的 作用 


21 实验 目的 

采用 词汇 判断 任务 , 操纵 词 首 和 词尾 词素 位 置 
概率 ， 以 高 频 目 标 词 为 研究 对 象 ,探讨 词素 位 置 概 
率 是 否 影响 被 试 的 词汇 识别 。 
2.0 ”实验 方法 
2.2.1 tit 

60 名 天 津 师范 大 学 在 校 学 生 ， 其 中 女生 40 名 ， 
男生 20 名 , 年 龄 在 18-22 岁 之 间 (M = 19.70, SD = 
1.94)。 被 试 均 为 汉语 母语 者 ,视力 或 矫正 视力 正常 ， 
均 不 知 实验 目的 ,实验 结 束 可 获得 一 定 报酬 。 为 保 
证 较 高 的 统计 效能 (Faul et al.，2007), 在 实验 实施 
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前 采用 G*power 分 析 方 法 对 样本 量 进 行 估 算 。 根 据 
中 等 效应 量 水平 (f = 0.25) 0.01 的 a 水 平 , G* power 
分 析 结 果 建 议 实 验 需 要 48 名 被 试 可 使 统计 效能 达 
到 0.95。 考 虑 到 可 能 有 无 效 被 试 ， 实际 取样 60 名 。 
2.2.2 ”实验 设计 

采用 2 ( 词 首 词素 位 置 概率 : 高 、 低 ) x 2 (词尾 
词素 位 置 概率 : 高 、 低 ) 的 两 因素 被 试 内 重复 测量 设计 。 
2.2.3 ”实验 材料 

参照 中 国电 视 电 影 旁 白 的 汉语 词汇 和 笔画 频 


和 语义 透明 度 进行 评定 ， 其 中 1 代表 “非常 不 熟悉 ” 
5 代表 “非常 熟悉 ”, 1~5 的 变化 代表 词语 熟悉 性 的 增 
强 ， 目 标 词 的 熟悉 度 为 M = 4.18 (SD = 0.17); 语义 
透明 度 指 的 是 复合 词 的 语义 能 从 其 各 个 组 成 词素 
的 语义 推 知 的 程度 。 其 中 1 代表 “完全 不 透明 词 ” 5 
代表 “完全 透明 词 ”，1~5 的 变化 代表 语义 透明 度 的 
增强 ， 目 标 词 的 语义 透明 度 为 M = 4.24 (SD = 
0.15)。 实 验 材料 的 基本 参数 情况 见 表 1。 

为 平衡 词汇 判断 的 对 错 项 目 数 , 在 材料 中 加 入 


率 语料库 (Cai & Brysbaert, 2010)， 为 保证 词素 位 置 
概率 条 件 的 区 分 度 , 将 词素 位 置 概率 高 于 0.7 定义 
为 高 概率 , 低 于 0.3 定义 为 低 概率 。 词 素 位 置 概率 
计算 方法 : 汉字 出 现在 词 首 或 词尾 时 双 字 词 的 数量 
除 以 汉字 所 能 组 成 的 所 有 双 字 词 ( 无 论 出 现在 首 字 
还 是 尾 字 ) 的 数量 。 操纵 词素 位 置 概率 的 高 低 ， 共 选 
取 80 个 双 字 词 , 将 其 分 为 4 种 条 件 ( 每 种 条 件 下 20 
个 双 字 词 ): (1) 高 词 首 词素 位 置 概率 、 高 词尾 词素 位 
置 概率 ; (2) 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 


填充 词 构成 “ 否 ” 反 应 。 填 充 词 是 由 真 字 构成 的 假 词 ， 
其 中 假 词 中 字 的 笔画 与 真 词 中 字 的 笔画 差异 不 显 
著 , t< 1, p > 0.05; 假 词 中 的 字 频 与 真 词 中 的 字 频 
差异 不 显著 ,1< 1,p> 0.05。 
2.2.4 ”实验 仪器 

实验 采用 联想 ThinkPad T-14 笔记 本 电脑 ， 屏 
幕 为 14 英寸 , 分辨 率 为 1024x728 像素 ,刺激 为 32 
号 宋体 ,每 个 汉字 大 小 约 为 41x41 RR, WARS 
字 方 式 呈 现 。 被 试 眼 睛 与 屏幕 之 间 的 距离 为 75 em, 


概率 ; (3) 低 词 首 词素 位 置 概率 、 高 词尾 词素 位 置 概 
率 ; (4) 低 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概 
率 。 控 制 4 种 条 件 下 双 字 词 的 词 频 差 异 不 显著 (F(3， 
124) =0.15, p= 0.92)、 词 首 笔画 数 差 异 不 显著 (F(3， 
124) =2.19, p=0.09), is] EE il 25 HA (FB, 
124) = 124, p = 0.21) 、 词 首 字 频 (F(3, 124) = 0.98, p= 
0.40) 和 词尾 字 频 (F(3, 124) = 0.42, p = 0.73) 的 差异 
不 显著 。 考虑 到 词素 结构 可 能 对 词汇 认 知 加 工 造成 
影响 ,材料 选取 时 尽 可 能 避免 选取 偏 正 复合 词 和 含 
有 词缀 的 双 字 词 。 同 时 ， 对 双 字 词 词 首 和 词尾 的 构 
词 能 力 进行 了 控制 ， 构 词 能 力 是 指 词素 所 能 构成 双 
字 词 的 数量 ( 汉 丽 萍 ， 宋 志明 ,2004), 例如 ,在 语 料 
库 中 “ 透 ” 字 可 以 组 成 “透明 ”"“ 透 彻 "、“ 看 透 " 等 20 
个 词 , 那么 其 构 词 能 力 即 为 20。4 种 条 件 词 首 和 词 
尾 的 构 词 能 力 之 间 差 异 不 显著 ,ts < 1, ps> 0.05。 此 
外 , 请 15 名 不 参加 实验 的 同学 对 目标 词 的 熟悉 度 


每 个 汉字 约 为 1.1° 视 角 。 
2.2.5 ”实验 程序 

实验 使 用 E-prime 2.0 编程 。 首先 , 被 试 阅读 指 
导语 理解 实验 程序 ,实验 开始 时 ,屏幕 中 央 呈 现 “+” 
注视 点 , 800 ms 后 注视 点 消失 ,接着 呈现 一 个 词语 ， 
被 试 需 快 而 准 地 进行 真 假 词 判 断 ， 若 是 真 词 按 “F” 
WE, 若是 假 词 按 “T" 键 。 目 标 词 在 被 试 做 出 反应 或 
3000 ms 后 消失 。 反 应 后 空 屏 600 ms 进入 下 一 试 次 。 
实验 材料 随机 呈现 ， 为 避免 练习 效应 按键 反应 在 左 
右手 间 平 衡 。 实 验 前 是 10 个 试 次 的 练习 ,正确 率 达 
90% 以 上 开始 正式 实验 ,实验 需 15 分 钟 。 实 验 流程 


LAL 1。 
2.3 ”实验 结果 


数据 分 析 时 ， 填 充 材 料 不 参与 分 析 。 数 据 分 析 
过 程 中 删除 了 错误 反应 的 反应 时 数据 以 及 大 于 或 小 
于 3 个 标准 差 的 极端 值 ， 占 有 效 被 试 数据 的 1.2%。 


R1 实验 材料 基本 参数 情况 

词素 位 置 目标 词 WAR 词尾 词素 整 词 词 词尾 词 词尾 

概率 类 型 举例 位 置 概率 位 置 概率 词 频 笔画 数 笔画 数 字 频 字 频 
高 词 首 -高 词尾 ”总 部 0.81(0.10) 0.78 (0.09) 50.39(19.62) 9.30(2.05) 8.25 (3.62) 271.99 (230.75) 287.99 (263.62) 
高 词 首 - 低 词尾 ”预约 0.80(0.10) 0.29(0.15) 54.15 (58.73) 9.35(2.01) 8.65 (3.00) 220.14 (165.11) 239.37 (158.56) 
低 词 首 - 高 词尾 “利益 0.25 (0.05)  0.78(0.10) 52.81 (42.72) 9.70 (2.60) 7.85 (2.54) 332.77 (188.32) 320.28 (239.62) 
低 词 首 - 低 词尾 ”派对 0.27(0.06) 0.29 (0.17) 46.02 (29.63) 7.85 (3.08) 7.35 (2.30) 279.91 (248.53) 296.99 (258.88) 
È: 高 词 首 -高 词尾 = 高 词 首 词素 位 置 概率 、 高 词尾 词素 位 置 概率 ; 高 词 首 - 低 词尾 = 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 ; 


低 词 首 -高 词尾 = 低 词 首 词素 位 置 概率 、 高 词尾 词素 位 置 概率 ; 低 词 首 - 低 词尾 = 低 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概率 ， 以 


下 同 。 词 频 和 字 频 的 单位 为 次 / 


万 ,括号 内 为 标准 差 ， 以 下 同 。 
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600 ms 


图 1 实验 1 流程 图 
ik: 例 词 “消失 ”表示 高 词 首 词素 位 置 概率 、 低 词尾 词素 位 置 概 
率 条 件 ， 即 “ 消 ” 词 首 词 素 位 置 概率 0.85,“ 失 ”词尾 词素 位 置 概率 
0.24, 


2.3.1 ”错误 率 
被 试 在 不 同 词素 位 置 概率 条 件 下 的 平均 错误 
率 如 表 2 所 示 。 


表 2 不同 词 素 位 置 概率 条 件 下 的 平均 错误 率 


词素 位 置 概率 类 型 错误 率 
高 词 首 - 高 词尾 0.01 (0.11) 
高 词 首 - 低 词尾 0.02 (0.14) 
低 词 首 - 高 词尾 0.02 (0.13) 
低 词 首 - 低 词尾 0.02 (0.15) 


TE: 括号 内 为 标准 差 ， 以 下 同 。 


使 用 R 统计 软件 (R Development Core Team, 
2016) 以 及 lme4 工具 包 (Bates et al., 2017), 采用 广 
义 线 性 混合 模型 (Generalized Linear Mixed-effects 
Models，GLMMSs) 对 错误 率 数据 进行 分 析 。 对 比 传 
统 的 方差 分 析 (ANOVA), 线性 混合 模型 将 全 部 原 
始 数据 纳入 模型 ， 数 据 利 用 率 更 高 ,在 计算 数据 时 
采用 最 大 随机 效应 结构 ,将 被 试 和 项 目 定 义 为 交叉 
随机 效应 (crossed random effects) 同 时 纳入 模型 ， 可 
有 效 规 避 被 试 分 析 (F1 检验 ) 和 项 目 分 析 (F2 检验 ) 检 


结果 显示 , 词 首 词素 位 置 概率 (z = 0.35, p = 
0.73) 和 词尾 词素 位 置 概率 (z = 1.07, p = 0.29) 的 主 
效应 均 不 显著 ; 二 者 交互 作用 不 显著 (z = -0.81,p = 
0.42)。 结果 表明 高 频 词 条 件 下 词素 位 置 概率 不 影响 
被 试 的 错误 率 。 
2.3.2 ”反应 时 

被 试 在 不 同 词素 位 置 概率 条 件 下 的 平均 反应 
时 如 表 4 所 示 。 


表 4 不 同 词素 位 置 概率 条 件 下 的 平均 反应 时 (ms) 


词素 位 置 概率 类 型 反应 时 
高 词 首 -高 词尾 596 (166) 
高 词 首 - 低 词 尾 608 (189) 
低 词 首 -高 词尾 589 (153) 
低 词 首 - 低 词 尾 604 (184) 


TE: 反应 时 的 单位 是 ms, 括号 内 为 标准 差 . 以 下 同 。 


使 用 R 统计 软件 (R Development Core Team, 
2016) 以 及 Ime4 工具 包 (Bates et al., 2017), 采用 线 
性 混合 模型 (Linear Mixed-effects Models, LMMs) 对 
反应 时 数据 进行 分 析 , 统计 结果 见 表 50 


表 5 不 同 词素 位 置 概 率 条 件 下 反应 时 的 线性 混合 模型 


统计 结果 
效应 b SE t 95% CI 
截 距 6.37 0.02 373.30™” [6.33, 6.40] 
词 首 词素 位 置 概率 -0.01 0.02 -0.51  [-0.04, 0.02] 
词尾 词素 位 置 概率 0.02 0.001 1.19  [-0.01, 0.05] 
词 首 x 词尾 词素 位 置 概率 0.01 0.03 — 0.18 — [-0.05, 0.06] 


结果 显示 , 词 首 词素 位 置 概率 (1 = -0.51, p = 
0.62) 和 词尾 词素 位 置 概率 (1 = 1.19, p = 0.24) 的 主 效 
应 均 不 显著 ; 二 者 交互 作用 不 显著 (t = 0.18, p = 
0.86)。 结 果 说 明 高 频 词 条 件 下 首 、 尾 词素 位 置 概率 


验 结果 不 一 致 的 情况 ,使 计算 结果 更 加 统一 和 稳 
定 。 统 计 结 果 见 表 3。 


表 3 不 同 词素 位 置 概率 条 件 下 错误 率 的 线性 混合 模型 


统计 结果 

效应 b SE z 95% CI 
截 距 -9.32 21.37 -—6.81'" [~12.00,—6.64] 
词 首 词素 位 置 概率 045 1.29 035 [-2.07, 2.97] 
词尾 词素 位 置 概率 138 1.29 1.07 [-1.15, 3.19] 
D RUBRI Sog 2.5] -0.81 [-7.11, 2.95] 


概率 
注 : *p < 0.05, * p «0.01, "p «0.001, LA F lal, CI = Confidence 
Interval (置信 区 间 )， 以 下 同 。 


影响 词汇 识别 。 
2.4 讨论 

实验 la 结果 表明 , 加 工 高 频 词 时 词 首 与 词尾 
词素 位 置 概率 的 高 低 不 影响 被 试 反应 时 。 一 些 研究 
提示 词 频 可 影响 单词 的 表征 ， 高 频 词 由 于 常 一 起 呈 
现 , 在 通达 表征 层 逐 渐 形 成 独立 表征 ; 而 低频 词 可 
能 依赖 分 解 的 途径 通过 词素 进行 通达 ( 彭 聘 龄 等 ， 
1999)。 有 研究 指出 低频 双 字 词 识 别 过 程 中 存在 词 
素 语义 激活 ， 词 素 意 义 和 整 词 意义 之 间 相 互 作 用 ， 
当 二 者 意义 相近 时 相互 促进 ,而 且 高 频 双 字 词 词素 
语义 激活 不 明显 ， 整 词语 义 的 激活 并 不 慢 于 词素 ， 
词素 通达 并 不 是 整 词 通达 的 必 经 阶段 ( 俞 林 乌 ， 
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2006)。 另 有 实验 证 据 表 明 ， 双 字 词 的 词 频 高 时 ， 词 
素 频率 效应 不 显著 ， 即 词 频 与 词素 频率 的 作用 是 竞 
争 的 ,但 词 频 发 挥 了 更 强 的 作用 ， 高 词 频 抑 制 了 词 
素 频 率 的 效应 ( 王 德 强 , 2013)。 可 见 , 词素 的 特性 受 
到 整 词 属性 的 制约 。 

总 结 以 往 人 研究 可 知 ， 与 高 频 预测 性 目标 词 相 比 ， 
读者 在 加 工 低频 预测 目标 词 时 耗费 的 资源 更 多 ， 词 
汇 加 工 的 层次 也 更 深 (吴琼 , 2013)。 来 自 拼音 文字 的 
研究 显示 ， 当 复合 词 为 长 词 (平均 12~13 个 字符 ) 时 ， 
如 breastbone， 词素 breast 和 bone 的 词 频 会 影响 注 
视 词 的 加 工时 间 (Hy6nai et al., 2004); 当 复 合 词 变 
成 短 词 (平均 7~9 个 字符 ) 时 ， 词 素 词 频 的 作用 有 限 ， 
而 是 整 词 词 频 影响 目标 词 的 注视 时 间 。Li 和 
Pollatsek (2020) 认 为 词汇 识别 是 从 视觉 信息 开始 ， 
之 后 是 字 层 面 的 加 工 ， 最 后 是 词 层面 的 加 工 。 因 此 ， 
字 层 面 的 词素 位 置 概率 的 加 工 水 平 是 低 于 词汇 层 


3.022 ”实验 设计 

同 实 验 1a。 
3.2.3 ”实验 材料 

参照 中 国电 视 电 影 旁白 的 汉语 词汇 和 笔画 频 
率 语料库 (Cai & Brysbaert, 2010)， 为 保证 词素 位 置 
概率 条 件 的 区 分 度 ， 将 词素 位 置 概率 高 于 0.7 定义 
为 高 概率 , 低 于 0.3 定义 为 低 概率 。 操 纵 词素 位 置 
概率 的 高 低 ， 共 选取 120 个 双 字 词 , 将 其 分 为 4 种 
条 件 (每 种 条 件 下 30 个 双 字 词 ): (1) 高 词 首 词素 位 置 
概率 、 高 词尾 词素 位 置 概率 ; (2) 高 词 首 词素 位 置 概 
率 、 低 词尾 词素 位 置 概率 ; (3) 低 词 首 词素 位 置 概率 、 
高 词尾 词素 位 置 概率 ; (4) 低 词 首 词素 位 置 概率 、 低 
词尾 词素 位 置 概率 。 控 制 4 种 条 件 下 双 字 词 的 词 频 
(FQ, 116) = 0.62, p = 0.60)、 词 首 笔画 数 (F(3, 116) = 
1.28, p = 0.12)、 词 尾 笔画 数 (F(3, 116) = 0.74, p = 
0.52)、 词 首 字 频 (F(3, 116) = 1.49, p = 0.09) 和 词尾 


面 的 ， 词 素 位 置 概率 信息 没有 词汇 层面 信息 的 丰富 
性 。 如 在 高 频 或 高 预测 性 条 件 下 , 读者 可 能 更 依赖 
整 词 词 频 或 整体 语 境 去 识别 词汇 。 对 比 而 言 ， 低 频 
词 条 件 由 于 缺少 了 整 词 提供 的 丰富 的 词汇 信息 ， 词 
素 特 性 得 以 展现 ， 此 时 词素 位 置 概率 信息 可 能 会 发 
挥 作用 。 为 此 ， 当 目标 词 变 为 低频 条 件 时 ， 是 否 存 
在 词素 位 置 概率 效应 ? 首 、 尾 词素 位 置 概率 信息 对 
视觉 词汇 加 工 的 重要 程度 如 何 ? 实验 lb 将 探究 在 
低频 词 条 件 下 词素 位 置 概率 在 词汇 识别 中 的 作用 ， 
以 期 全 面 考察 整 词 词 频 对 词素 位 置 概率 效应 的 影响 。 


3 实验 lb: 词 系 位 置 概率 在 低频 词 
词汇 识别 中 的 作用 


3.1 实验 目的 

采用 词汇 判断 任务 , 操纵 词 首 和 词尾 词素 位 置 
概率 ,考察 在 低频 词 条 件 下 被 试 词汇 判断 的 成 绩 
异 , 探究 词素 位 置 概率 线索 在 词汇 识别 中 的 作用 。 
3.0 ”实验 方法 
3.2.1 tit 

同 实验 la. 


字 频 (F(3, 116) = 1.58, p = 0.08) 的 差异 不 显著 。 考虑 
到 词素 结构 可 能 对 词汇 认 知 加 工 造成 影响 ,材料 选 
取 时 尽 可 能 避免 选取 偏 正 复合 词 和 含有 词缀 的 双 
字 词 。 同 时 ,控制 4 种 条 件 词 首 和 词尾 的 构 词 能 
之 间 差 异 不 显著 , ts < 1, ps > 0.05。 此 外 , 请 15 名 
不 参加 实验 的 同学 对 目标 词 的 熟悉 度 和 语义 透明 
度 进行 评定 ， 其 中 1 代表 “非常 不 熟悉 ”，5 代表 “ 非 
常熟 悉 ”，1~5 的 变化 代表 词语 熟悉 性 的 增强 ,目标 
词 的 熟悉 度 为 M= 3.98 (SD = 0.22); 语义 透明 度 指 
的 是 复合 词 的 语义 能 从 其 各 个 组 成 词素 的 语义 推 
知 的 程度 。 其 中 1 代表 “完全 不 透明 词 ” 5 代表 “ 完 
全 透明 词 ”，1~5 的 变化 代表 语义 透明 度 的 增强 ， 目 
标 词 的 语义 透明 度 为 M = 4.13 (SD = 0.35), FE, 
目标 词 的 词 频 显著 低 于 实验 la 中 目标 词 的 词 频 (t= 
—9.84, p < 0.001)。 实 验 材 料 的 基本 参数 情况 见 表 6。 

为 平衡 词汇 判断 的 对 错 项 目 数 ,在 实验 材料 中 
加 入 了 填充 词 , 构成 了 “ 否 ” 反 应 。 填 充 词 是 由 真 字 
构成 的 假 词 ， 其 中 假 词 中 字 的 笔画 与 真 词 中 字 的 笔 
画 差 异 不 显著 , ! < 1, p > 0.05; 假 词 中 的 字 频 与 真 
词 中 的 字 频 差异 不 显著 ,t= 1.70, p > 0.05。 


表 6 实验 材料 的 基本 参数 情况 


词素 位 置 目标 词 ” 词 首 词素 ， 词尾 词素 整 词 词 词尾 词 首 词尾 

概率 类 型 举例 “位置 概率 位 置 概率 词 频 笔画 数 笔画 数 字 频 字 频 
高 词 首 -- 高 词尾 。” 消炎 0.83(0.08) 0.80(0.08) 2.01 (2.24) 9.53(1.54) 9.56(2.64) 174.69 (172.63) 165.10 (187.62) 
高 词 首 - 低 词 尾 ”批改 ”0.82(0.09) 0.22(0.09) 1.81 (2.19) 8.96(2.83) 9.73 (2.98) 107.51 (84.93) 105.10 (74.77) 
低 词 首 - 高 词尾 ”疗程 0.21(0.06) 0.81(0.06) 2.02 (2.67) 9.33 (2.20) 8.83 (2.57) 177.33 (151.27) 177.38 (166.89) 
低 词 首 - 低 词尾 ”类推 0.25(0.06) 0.26(0.06) 1.74(1.64) 8.06(2.06) 9.66(2.30) 226.33 (212.62) 234.87 (289.21) 
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3.2.4 ”实验 仪器 

同 实验 lao 
3.2.5 ”实验 程序 

同 实 验 1a。 
3.3 ”实验 结果 

数据 分 析 时 ,填充 材料 不 参与 分 析 。 数 据 分 析 
过 程 中 删除 了 错误 反应 的 反应 时 数据 以 及 大 于 或 
小 于 3 个 标准 差 的 极端 值 ， 占 有 效 被 试 数据 的 
1.6%. 
3.3.1 ”错误 率 

被 试 在 不 同 词素 位 置 概率 条 件 下 的 平均 错误 
率 如 表 7 所 示 。 


表 7 不 同 词素 位 置 概率 条 件 下 的 平均 错误 率 


词素 位 置 概率 类 型 错误 率 
高 词 首 - 高 词尾 0.05 (0.21) 
高 词 首 - 低 词尾 0.06 (0.24) 
低 词 首 -高 词尾 0.13 (0.31) 
低 词 首 - 低 词 尾 0.13 (0.33) 


使 用 R 统计 软件 (R Development Core Team, 
2016) 以 及 lme4 工具 包 (Bates et al., 2017), 采用 广 
义 线 性 混合 模型 (Generalized Linear Mixed-effects 
Models, GLMMs) 对 错误 率 数 据 进行 分 析 。 将 词 首 、 
词尾 词素 位 置 概率 以 及 它们 之 间 的 交互 作用 作为 
固定 因素 纳入 模型 进行 分 析 , 统计 结果 见 表 8。 


表 8 不 同 词素 位 置 概 率 条 件 下 错误 率 的 线性 混合 模型 


统计 结果 
效应 b SE 95% CI 
截 距 -2.77] 0.17 —16.28"" [-3.11, —2.44] 
词 首 词素 位 置 概率 1.08 0.09 11.58 [0.90, 1.26] 
词尾 词素 位 置 概率 0.15 0.09 1.57 [-0.04, 0.33] 
词 首 x 词 尾 词素 位 置 概率 -0.31 0.19 -1.69 — [-0.68, 0.05] 


1 统计 结果 可 见 ， 词 首 词素 位 置 概率 的 主 效 应 
显著 (z = 11.58, p < 0.001), 词尾 词素 位 置 概率 的 主 
效应 不 显著 (z = 1.57, p = 0.11), 二 者 的 交互 作用 不 
显著 (z = 一 1.69, p= 0.09)。 结果 表明 , 词 首 词素 位 置 
概率 在 词汇 识别 中 起 了 显著 作用 。 
3.3.2 ”反应 时 

被 试 在 不 同 词素 位 置 概率 条 件 下 的 平均 反应 
时 如 表 9 所 示 。 

使 用 R 统计 软件 (R Development Core Team, 
2016) 以 及 Ime4 工具 包 (Bates et al., 2017), 采用 线 
性 混合 模型 (Linear Mixed-effects Models, LMMs) 对 


`i 


反应 时 数据 进行 分 析 。 统 计 结果 见 表 10. 
RO 不 同 词素 位 置 概率 条 件 下 的 平均 反应 时 


词素 位 置 概率 类 型 反应 时 
高 词 首 -高 词尾 718 (205) 
高 词 首 - 低 词 尾 736 (238) 
低 词 首 - 高 词尾 809 (287) 
低 词 首 - 低 词 尾 790 (289) 


表 10 不 同 词素 位 置 概率 条 件 下 反应 时 的 线性 混合 模型 统计 结果 


效应 b SE t 95% CI 
截 距 6.61 0.02 360.14"" [6.58, 6.65] 
词 首 词素 位 置 概率 0.10 0.02  5.22'" [0.06, 0.13] 
词尾 词素 位 置 概率 0.00 0.02 -0.03  [-0.05, 0.04] 
词 首 x 词尾 词素 位 置 概率 -0.05 0.04 -1.34 — [-0.13, 0.02] 


由 统计 结果 可 见 , 词 首 词素 位 置 概率 的 主 效应 
显著 (! = 5.22, p < 0.001), 词尾 词素 位 置 概率 的 主 
效应 不 显著 (! = -0.03, p = 0.97), 二 者 的 交互 作用 
不 显著 ((= -1.34, p= 0.19)。 结果 表明 ,与 词尾 词素 
位 置 概率 相 比 ， 词 首 词素 位 置 概率 对 词汇 识别 的 作 


用 更 大 。 
3.3.3 词 首 词 素 位 置 概率 和 反应 时 的 简单 线性 回 
归 模 型 


实验 lb 的 结果 显示 ， 被 试 的 反应 时 随 词 首 词 
素 位 置 概率 的 升降 而 变化 ,二 者 之 间 呈 现 出 一 定 程 
度 的 相关 关系 。 为 了 检验 这 种 相关 关系 的 确切 程度 
及 方向 性 ， 尝试 根 据 词 素 位 置 概率 建立 读者 词汇 判 
断 反 应 时 的 最 优 回归 模型 ， 以 期 从 更 直观 的 线性 模 
型 视角 描述 词素 位 置 概率 与 词汇 加 工 的 关系 。 

(1) 建 立 简单 线性 回归 模型 

运用 最 小 二 乘法 建立 简单 线性 回归 的 数学 模型 ; 

Y =Po + BX +e 

公式 中 以 反应 时 为 因 变 量 , 词 首 词素 位 置 概率 
为 自 变 量 , po 为 常数 项 ， 表 示 截 距 项 参数 ; B1 为 回 
归 系 数 , 表示 自 变 量 针 每 变化 1 个 单位 时 ， 其 单独 
引起 因 变 量 了 的 平均 变化 量 ; 为 随机 误差 项 ， 表示 
xm p X VA, Bout sem Y Bp SR o 借助 
R 统计 软件 (R Development Core Team, 2016) 以 及 
ggpubr 工具 包 对 数据 进行 简单 线性 回归 分 析 , 计算 
词 首 词素 位 置 概率 和 词汇 判断 反应 时 的 相关 性 ， 结 
RER, 反应 时 与 词 首 词素 位 置 概率 呈 显 著 负 相关 
(r = —0.38, p < 0.001). 

(2) 整 体 回归 模型 的 显著 性 检验 

对 回归 模型 的 整体 做 显著 性 检验 , 结果 显示 回 
归 方 程 高 度 显 著 , FC, 118) = 19.93, p < 0.001, 这 说 
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明 反 应 时 与 词 首 词素 位 置 概率 间 的 线性 回归 关系 
密切 。 

(3) 回 归 系 数 的 显著 性 检验 

对 回归 系数 进行 显著 性 检验 ， 即 变量 系数 的 1 
检验 。 以 反应 时 为 因 变 量 ， 以 词 首 词素 位 置 概率 为 
自 变 量 , 经 由 R 数据 软件 建立 简单 线性 回归 方程 ， 
统计 结果 见 表 11 和 图 2。 


表 11 词 首 词素 位 置 概 率 对 反应 时 的 简单 线性 回归 结果 
效应 b SE t p 
截 距 848.01 18.46 45.94 0.000 
词 首 词素 位 置 概率 ”一 135.13 30.27 | -447 0.001 
Hm 70.14, p«0.001 
1000 . 
900L. ° 
E “ 
800 : 
t 
mo} `e uus 
4 L] px py stes 
600 : : ” : 
0.25 0.50 0.75 1.00 
Initial 


图 2 词 首 词素 位 置 概率 对 反应 时 的 简单 线性 回归 图 
注 : RT= 反应 时 , Initial = 词 首 词素 位 置 概率 


1 表 11 和 图 2 的 结果 可 见 , 模型 的 回归 系数 显 
著 , 为 此 得 出 估计 的 回归 方程 : 
Y=—135.13X + 848.01 

1 回归 方程 可 知 ， 词 首 词素 位 置 概率 与 反应 时 
旺 显著 负 相 关 关 系 ， 即 词 首 词素 位 置 概率 每 增加 1 
个 单位 , 读者 反应 时 减少 135.13 ms, 可 见 词 首 词 
素 位 置 概率 显著 影响 读者 的 词汇 加 工 。 这 启示 我 们 
可 根据 词素 位 置 概率 来 预测 读者 的 反应 时 ， 这 对 中 
文 读者 阅读 行为 的 探究 具有 现实 指导 意义 。 
3.4 讨论 

实验 lb 反应 时 数据 提示 ， 词 首 词素 位 置 概率 
的 主 效应 显著 而 词尾 不 显著 ， 即 不 论 双 字 词 词尾 词 
素 位 置 概率 高 低 与 否 ,， 只 要 词 首 词素 位 置 概率 高 时 ， 
词汇 判断 时 间 便 显著 减少 。 错 误 率 数据 进一步 肯定 
了 词 首 的 加 工 优势 。 同 时 ， 观 察 反 应 时 的 线性 回归 
模型 发 现 , 被 试 词汇 判断 的 反应 时 与 词 首 词 素 位 置 
概率 呈现 显著 的 负 相 关 关 系 ,， 词 首 词素 位 置 概率 增 
加 ,词汇 判断 反应 时 减少 。 Cui 等 人 (2014) 应 用 边界 


范式 发 现 ， 词 首 词素 字 频 的 识别 制约 着 词尾 词素 的 
识别 ， 且 词尾 词素 语义 的 获得 还 受到 了 词 首 词素 字 
频 的 调节 。Bertram 等 人 (2004) 发 现 与 词 首 词素 字 频 
较 低 的 条 件 相 比 ,， 词 首 词素 字 频 较 高 时 复合 词 的 注 
视 时 间 显著 降低 。 后 续 研 究 进一步 巩固 了 词 首 词素 
的 主体 地 位 ,长 复合 词 中 读者 首先 加 工 词 首 ， 然 后 
加 工 词 尾 , 最 后 加 工整 词 (Hy5ni et al., 2004; Pollatsek 
& Hyónà, 2005). 

中 文 阅读 研究 认为 词汇 加 工 早 期 阶段 是 词素 
层次 的 通达 , 词素 身份 信息 起 主要 作用 ， 晚 期 是 整 
词 的 检验 ,词素 位 置信 息 开始 起 作用 ( 彭 聘 龄 等 ， 
1999), 词素 身份 信息 确定 后 读者 开始 加 工 词 素 的 
位 置信 息 ， 而 单独 呈现 双 字 词 时 ， 词 素 位 置信 息 的 
重要 性 在 早期 阶段 表现 明显 (吴琼 ，2013)， 当 词素 
经 常 出 现在 某 一 位 置 时 ， 则 对 词素 位 置 产 生 了 期 
待 。 例 如 ,“ 批 ” 字 组 成 的 复合 词 中 其 常 出 现在 词 首 ， 
如 “批改 ”、“ 批 评 ”， 读 者 在 学 习 和 阅读 过 程 中 常 接 
受 这 一 讯息 ,加深 了 心理 词典 中 * 批 ”居于 词 首 的 印 
象 ， 对 “ 批 ” 位 于 词 首 也 产生 更 多 期 待 。 当 看 到 ”“ 批 
改 ” 时 ,， 词 首 “ 批 ?被 激活 的 同时 所 携带 的 高 词素 位 
置 概率 特征 亦 被 激活 。 此 时 ， 如 果 被 试 觉察 到 当前 
汉字 实际 位 置 与 期 望 位 置 相符 ， 词 的 激活 水 平 比 较 
高 ,词汇 识别 时 间 较 短 。 一 旦 读者 发 现 当前 汉字 实 
际 位 置 与 期 望 位 置 相 矛盾 ， 如 “ 批 ? 字 出 现在 不 常 出 
现 的 词尾 位 置 , 组 成 “分 批 "一 词 ， 被 试 需 花 费 额 外 
的 认 知 资源 处 理 这 一 冲突 ， 词汇 识别 时 间 延 长 。 综 
上 ,低频 词 条 件 下 词素 特征 信息 得 以 表达 ， 而 加 工 
高 频 词 的 词素 位 置 概率 信息 时 ， 其 词素 语义 激活 相 
对 较 弱 ， 以 整 词 形式 完成 了 词汇 识别 , 为 此 词素 提 
供 的 位 置 概率 信息 被 掩盖 。 两 个 实验 以 词汇 判断 的 
方式 独立 呈现 双 字 词 的 词素 位 置 ， 一 般 而 言 读 者 是 
在 句子 中 理解 词汇 , 那么, 在 贴近 自然 阅读 的 句子 
中 ,词素 位 置 概 率 是 否 还 会 发 生 作 用 ? 首 、 尾 词素 
位 置 概 率 作 用 的 发 挥 是 否 一 致 ”实验 2a 将 探索 处 
于 生态 效 度 更 高 的 自然 阅读 中 词素 位 置 概率 的 现 
实效 用 。 


4 实验 2a: 高 频 词 条 件 下 词素 位 置 
概率 在 句子 阅读 中 的 作用 


4.1 实验 目的 

通过 操纵 词 首 和 词尾 的 词素 位 置 概率 的 高 低 ， 
进一步 考察 在 自然 阅读 过 程 中 词素 位 置 概率 线索 
是 否 会 影响 被 试 的 词汇 识别 与 切 分 。 
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4.2 ”实验 方法 
4.2.1 it 

60 名 天 津 师范 大 学 在 校 学 生 ， 其 中 女生 42 名 ， 
男生 18 名 , 年 龄 在 18-24 岁 之 间 (M = 19.33, SD = 
1.54)。 被 试 均 为 汉语 母语 者 ,视力 或 矫正 视力 正常 ， 
均 不 知 实验 目的 ,实验 结束 可 获得 一 定 报 酬 。 
4.2.2 ”实验 设计 

采用 2 ( 词 首 词素 位 置 概率 : 高 、 低 ) x 2 (词尾 
词素 位 置 概率 : 高 、 低 ) 的 两 因素 被 试 内 重复 测量 设计 。 
4.2.3 ”实验 材料 

参照 中 国电 视 电影 旁白 的 汉语 词汇 和 笔画 频 
率 语料库 (Cai & Brysbaert, 2010), 为 保证 词素 位 置 
概率 条 件 的 区 分 度 ,将 词素 位 置 概率 高 于 0.7 定义 
为 高 概率 , 低 于 0.3 定义 为 低 概率 。 操 纵 词素 位 置 
概率 的 高 低 ， 共 选取 96 个 双 字 词 , 将 其 分 为 4 种 条 
件 ( 每 种 条 件 下 24 个 双 字 词 ): (1) 高 词 首 词素 位 置 概 
率 、 高 词尾 词素 位 置 概率 ; (2) 高 词 首 词素 位 置 概率 、 
低 词尾 词素 位 置 概率 ; (3) 低 词 首 词素 位 置 概率 、 高 
词尾 词素 位 置 概率 ; (4) 低 词 首 词 素 位 置 概率 、 低 词 
尾 词素 位 置 概率 。 控制 4 种 条 件 下 双 字 词 的 词 频 差 
异 不 显著 (F(G3, 92) = 0.23, p = 0.87)、 词 首 笔画 数 差 
异 不 显著 (F(3, 92) = 1.43, p = 0.23)、 词 尾 笔画 数 差 
异 不 显著 (F(3, 92) = 1.11, p = 0.35), WA EN, 
92) = 0.89, p = 0.44) Filta] FEF (FB, 92) = 0.18, p = 
0.90) 的 差异 不 显著 。 考虑 到 词素 结构 可 能 对 词汇 认 
知 加 工 造成 影响 ,材料 选取 时 尽 可 能 避免 选取 偏 正 
复合 词 和 含有 词缀 的 双 字 词 。 同 时 ， 控 制 4 种 条 件 
词 首 和 词尾 的 构 词 能 力 之 间 差 异 不 显著 , ts < 1， 
ps > 0.05。 请 15 名 不 参加 实验 的 同学 评定 目标 词 的 
熟悉 度 和 语义 透明 度 ， 其 中 1 代表 "非常 不 熟悉 ”5 
代表 “非常 熟悉 "，1~5 的 变化 代表 词语 熟悉 性 的 增 
ae, 目标 词 的 熟悉 度 为 M = 4.31 (SD = 0.12); 语义 
透明 度 指 的 是 复合 词 的 语义 能 从 其 各 个 组 成 词素 
的 语义 推 知 的 程度 。 其 中 1 代表 “完全 不 透明 词 ” 5 
代表 “完全 透明 词 ” 1-5 的 变化 代表 语义 透明 度 的 
增强 ， 目 标 词 的 语义 透明 度 为 M = 4.24 (SD = 


依据 目标 词 编制 句子 ， 目 标 词 出 现在 句子 中 间 
位 置 ， 句 子 长 度 在 18~20 个 汉字 之 间 。 请 15 名 不 
参加 正式 实验 的 大 学 生 评 定 句子 的 通顺 性 ， 从 
1“ 非 常 不 通顺 ?到 $“ 非 常 通顺 ”， 平均 通顺 性 为 M = 
4.22 (SD = 0.28)。 选 取 15 名 不 参加 正式 实验 的 大 学 
生 对 句子 的 难度 进行 5 级 评定 ， 从 1“ 非常 简单 ” 
到 $“ 非 常 难 ” 平均 难度 为 M = 1.86 (SD = 0.21)。 
同时 ， 对 双 字 词 词 首 和 词尾 的 构 词 能 力 进行 控制 , 4 
种 条 件 首 、 尾 的 构 词 能 力 差 异 不 显著 , ts < 1, ps > 
0.05。 另 选取 15 名 不 参加 正式 实验 的 大 学 生 对 句子 
的 预测 性 进行 评定 。 预 测 性 评定 采用 补充 句子 的 方 
式 , 即将 实验 句 中 目标 词 及 以 后 的 内 容 删 除 ， 让 被 
试 依据 所 剩 的 部 分 将 句子 补充 完整 。 如 果 被 试 所 填 
内 容 与 目标 词 一 致 ， 则 表明 预测 成 功 ， 计 1 分 ; 否 
则 表明 预测 失败 ， 计 0 分 。 经 计算 , 句子 的 平均 预 
测 性 为 : M = 0.012 (SD = 0.42), 说 明 目 标 词 的 可 预 
测 性 非常 低 。 为 了 避免 被 试 对 实验 句 形 成 反应 定 势 ， 
在 阅读 材料 中 随机 插入 填充 句 。 采 用 拉丁 方 平衡 设 
计 将 实验 材料 分 为 4 个 Block, 每 一 个 Block 包含 4 
个 练习 句 、24 个 实验 名 和 24 个 填充 句 。 实 验 材 料 
举例 如 表 13。 

4.2.4 ”实验 仪器 

采用 Eyelink 1000 plus 眼 动 仪 , 采样 频率 1000 
Hz。 显 示 器 分 辩 率 为 1920x1080, 刷新 率 140 Hz. 
被 试 与 屏幕 相距 75 cm。 实 验 材 料 的 汉字 为 32 号 宋 
体 , 汉字 为 41x41 像素 , 约 呈 0.75° 视 角 。 

4.2.5 ”实验 程序 

每 个 被 试 单独 施 测 。 首 先 ， 主 试 讲解 指导 语 确 
保 被 试 理解 实验 过 程 。 开 始 前 对 眼 动 仪 进行 三 点 校 
WE, 平均 误差 小 于 0.3。 之 后 被 试 阅读 屏幕 上 的 句子 ， 
句子 呈现 前 屏幕 左 侧 出 现 注视 点 “+”， 要 求 盯 住 “+” 
触发 句子 阅读 。 实验 包括 4 个 练习 人 句 , 24 个 实验 句 ， 
24 个 填充 句 ， 其 中 14 个 句子 后 面 有 简单 的 “是 ”或 
“ 否 ” 的 判断 题 ,“ 是 ”或 “ 否 ” 的 判断 各 占 一 半 ， 以 确 
保 被 试 认真 阅读 句子 。 实 验 材料 逐 屏 呈现 , 被 试 阅 
读 完 一 屏 后 按 空格 键 进入 下 一 个 句子 。 实验 过 程 中 


0.35)。 实 验 材 料 的 基本 情况 见 表 12。 每 读 完 5 个 句子 做 一 次 三 点 校准 ， 其 他 每 个 句子 做 
表 12 实验 材料 的 基本 情况 
词素 位 置 词 首 词素 词尾 词素 整 词 词 词尾 词 词尾 
概率 类 型 位 置 概率 位 置 概率 词 频 笔画 数 笔画 数 字 频 字 频 
高 词 首 -高 词尾 0.81 (0.10) 0.78 (0.10) 50.46 (21.72) 9.29 (2.14) 9.83 (3.63) 265.66 (219.63) 259.35 (252.95) 
高 词 首 - 低 词尾 0.81 0.11) 0.29(0.13) 56.11 (54.55) 9.33 (1.99) 8.54 (2.78) 224.31 (190.04) 292.32 (222.27) 
低 词 首 - 高 词尾 0.25 (0.05) 0.77 (0.09) 51.94 (41.73) 9.38 (2.76) 8.25 (2.65) 318.66 (200.94) 309.66 (239.24) 
低 词 首 - 低 词 尾 0.27(0.06) 0.29 (0.16) 46.77 (28.73) 8.08 (3.17) 8.29 (2.42) 307.86 (270.44) 297.05 (252.72) 
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表 13 实验 材料 举例 


词素 位 置 概率 类 型 A trial 例句 
高 词 首 -高 词尾 xt 参赛 队员 们 说 这 种 遗憾 是 别人 很 难 体会 的 。 
高 词 首 - 低 词尾 享受 参赛 队员 们 说 这 种 享受 是 别人 很 难 体会 的 。 
低 词 首 -高 词尾 责任 参赛 队员 们 说 这 种 责任 是 别人 很 难 体会 的 。 
低 词 首 - 低 词尾 想念 参赛 队员 们 说 这 种 想念 是 别人 很 难 体会 的 。 
注 : 加 粗 字 体 为 目标 词 ， 在 实验 中 均 以 正常 形式 呈现 。 


一 点 校准 。 主 试 实时 监视 眼 动 仪器 必要 时 进行 重新 
校准 ， 整 个 实验 大 约 15 分 钟 。 
4.2.6 “分析 指标 

参照 以 往 研 究 (Liang et al., 2015), 选取 首次 注 
视 时 间 、 凝 视 时 间 、 回 视 路 径 时 间 和 总 注视 时 间 进 
行 分 析 。 首 次 注视 时 间 是 指 首次 通过 兴趣 区 的 首 个 


注视 点 的 注视 时 间 ， 与 兴趣 区 内 有 多 少 注视 点 无 关 ; 


凝视 时 间 是 指 从 首次 注视 开始 到 注视 点 第 一 次 离 
开 所 在 兴趣 区 之 间 的 持续 时 间 ; 回 视 路 径 时 间 是 指 
从 首次 注视 开始 ， 到 注视 点 落 到 所 注视 兴趣 区 的 右 
侧 区 域 为 止 (不 包括 右 侧 区 域 这 一 注视 点 ), 之 间 所 有 
注视 点 持续 时 间 的 总 和 ; 总 注视 时 间 是 指 落 在 兴趣 
区 内 所 有 注视 点 的 持续 时 间 的 总 和 。 其 中 , 首次 注视 
时 间 和 凝视 时 间 是 反映 词汇 通达 早期 阶段 特征 的 有 
效 指 标 ， 回 视 路 径 时 间 既 能 反映 词汇 通达 的 过 程 ， 还 


间 反 映 的 是 词汇 加 工 的 总 体 过 程 ( 闫 国 利 等 , 2013)。 
4.3 ”实验 结果 

被 试 正确 率 在 85% 以 上 (SD = 4.2%), 说 明 其 认 
真 阅读 了 句子 ,参考 以 往 研究 的 数据 删除 标准 (Rayner, 
2009): (1) 删 除 注视 点 持续 时 间 小 于 80 ms 或 大 于 
1200 ms 的 注视 点 (1.9%)。(2) 删 除 单个 句子 注视 点 
少 于 5 个 的 试 次 或 追踪 丢失 的 数据 (0.42%)。 基 于 R 
语言 环境 (R Development Core Team, 2016) 下 的 线 
性 混合 模型 (Linear Mixed-effects Models, LMMs) 和 
lme4 数据 包 统计 数据 (Bates et al., 2017)。 分 析 时 对 
注视 时 间 进 行 了 log 转换 , 将 首 、 尾 词素 位 置 概率 
及 其 交互 作用 作为 固定 效应 纳入 模型 ， 被 试 和 项 目 
作为 交叉 随机 效应 。 首 先 从 最 大 效应 模型 开始 , 若 
模型 无 法 拟 合 则 依次 简化 最 大 模型 直至 拟 合 。 不同 
词素 位 置 概率 条 件 下 眼 动 指标 的 描述 统计 结果 见 


可 反映 词汇 后 期 加 工 和 语义 的 整合 过 程 ， 总 注视 时 ” 表 14, 线性 混合 模型 统计 结果 见 表 15. 
表 14 不 同 词素 位 置 概率 条 件 下 眼 动 指标 的 描述 统计 结果 
词素 位 置 概率 类 型 次 注视 时 间 (ms) 凝视 时 间 (ms) 回 视 路 径 时 间 (ms) 总 注视 时 间 (ms) 
高 词 首 - 高 词尾 242 (78) 267(101) 330 (226) 370 (226) 
高 词 首 - 低 词尾 252 (91) 279 (126) 364 (381) 398 (258) 
低 词 首 - 高 词尾 246 (78) 274 (123) 345 (264) 384 (227) 
低 词 首 - 低 词 尾 244 (87) 268 (115) 338 (234) 398 (268) 
表 15 不 同 词素 位 置 概率 条 件 下 线性 混合 模型 的 统计 结果 
分 析 指 标 效应 b SE t 95% CI 
词 首 词素 位 置 概率 —0.01 0.02 —0.14 [-0.04, 0.04] 
首次 注视 时 间 词尾 词素 位 置 概率 0.00 0.02 0.21 [-0.04, 0.05] 
词 首 x 词 尾 词 素 位 置 概率 —0.04 0.04 -1.01 [-0.12, 0.04] 
词 首 词素 位 置 概率 —0.01 0.03 —0.39 [-0.06, 0.04] 
凝视 时 间 词尾 词素 位 置 概率 0.00 0.03 -0.17 [-0.06, 0.05 
词 首 x 词 尾 词素 位 置 概率 一 0.05 0.05 —0.93 [-0.15, —0.05] 
词 首 词素 位 置 概率 0.00 0.04 0.06 [-0.06, 0.07 
回 视 路 径 时 间 词尾 词素 位 置 概率 0.00 0.04 0.02 [-0.07, 0.07 
词 首 x 词 尾 词 素 位 置 概率 —0.05 0.07 -0.70 [-0.19, 0.09] 
词 首 词素 位 置 概率 0.03 0.04 0.67 [-0.05, 0.11 
总 注视 时 间 词尾 词素 位 置 概率 0.02 0.04 0.69 [-0.06, 0.11 
词 首 x 词 尾 词 素 位 置 概率 —0.03 0.08 —0.38 [-0.20, 0.13] 
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根据 线性 混合 模型 的 统计 结果 ,， 词 首 词素 位 置 
概率 在 首次 注视 时 间 ((= —0.14, p = 0.89), 凝视 时 间 
(t = —0.39, p = 0.70)、 回 视 路 径 时 间 (t = 0.06, p = 
0.95) 以 及 总 注视 时 间 (( = 0.67, p = 0.51) 上 的 主 效应 
不 显著 ; 词尾 词素 位 置 概率 在 首次 注视 时 间 (t = 
0.21, p =0.84)、 凝视 时 间 (t= —0.17, p = 0.86)、 回 视 
路 径 时 间 (t = 0.02, p = 0.99) 及 总 注视 时 间 (t = 0.69, 
p = 0.50) 上 的 主 效应 不 显著 ; 首 、 尾 词素 位 置 概率 
在 首次 注视 时 间 ( = -1.01, p = 0.32), BEAMLETS TR] (1 = 
-0.93, = 0.36)、 回 视 路 径 时 间 ((= -0.70, = 0.49) 
及 总 注视 时 间 (t = -0.38, p = 0.71) 的 交互 作用 不 显 
著 。 研 究 结果 表明 ,高 频 词 条 件 下 词素 位 置 概率 未 
影响 读者 的 阅读 行为 。 

4.4 讨论 

实验 2a 结 果 表 明 ， 当 目标 词 为 高 频 词 时 ， 词 首 
与 词尾 不 同 词素 位 置 概率 水 平 下 的 注视 时 间 没 有 
显著 差异 -同时 ， 综 合 实验 1a 和 lb 的 结果 发 现 ， 当 
目标 词 为 低频 时 , 读者 能 利用 词 首 词素 位 置 概率 线 
索 指导 阅读 ,而 目标 词 变 为 高 频 时 , 词 首 词素 位 置 
概率 不 再 显著 影响 阅读 进程 ， 这 个 结果 与 复合 词 混 
合 通达 表征 模型 的 观点 较为 吻合 。Caramazza 等 人 
(1988) 提 出 的 混合 通达 表征 模型 (Augment Addressed 
Morphology) 认 为 ,词汇 识别 时 既 存 在 单独 的 词素 
表征 ,也 存在 整 词 表 征 ,， 词汇 识别 是 词素 与 整 词 激 
活 并 相互 作用 的 结果 。 例 如 ， 加工 “walked” 可 激活 
“walked”、“talked” 等 整 词 ， 也 可 激活 “walk”、“ed” 
这 样 的 词素 ， 整 词 与 词素 谁 先 达到 激活 阔 限 谁 便 在 
竞争 中 胜出 。 为 此 ， 对 于 新 词 或 低频 词 ， 由 于 在 通 
达 表 征 中 没有 相对 应 的 整 词 表征 ， 而 是 相应 的 词素 
被 激活 ， 词 素 单元 在 竞争 中 更 易 胜 出 ， 而 后 词素 所 
携带 的 位 置 概率 特征 可 能 被 激活 ; 而 对 于 熟悉 的 高 
频 词 ， 其 组 成 成 分 经 常 同时 出 现 , 倾向 形成 独立 的 
识别 单元 ,由 此 整 词 更 易 被 激活 继而 通达 了 语义 ， 
这 样 的 话 ， 可 能 会 减少 词素 位 置 概率 提取 或 使 用 的 
机 会 ， 词 素 携带 的 位 置 概率 信息 未 得 到 充分 表达 。 
为 此 , 实验 2b 将 探究 含 词素 位 置 概率 信息 的 低频 
目标 词 置 于 句子 中 的 眼 动 规律 ,进一步 厘清 首 、 尾 
词素 位 置 概率 在 词汇 加 工 中 的 重要 性 。 


5 实验 2b: 低频 词 条 件 下 词素 位 置 


响 被 试 的 词汇 识别 与 切 分 。 
5.2 ”实验 方法 
5.2.1 it 

同 实验 2a. 
5.2.2 ”实验 设计 

同 实验 2a。 
5.2.3 ”实验 材料 

参照 中 国电 视 电 影 旁白 的 汉语 词汇 和 笔画 频 
率 语料库 (Cai & Brysbaert, 2010)， 为 保证 词素 位 置 
概率 条 件 的 区 分 度 ,将 词素 位 置 概率 高 于 0.7 定义 
为 高 概率 , 低 于 0.3 定义 为 低 概率 。 操 纵 词 首 与 词 
尾 词素 位 置 概率 的 高 低 , 将 128 个 双 字 词 分 为 4 种 
条 件 (每 种 条 件 下 32 个 双 字 词 ): (1) 高 词 首 词 素 位 置 
概率 、 高 词尾 词素 位 置 概率 ; (2) 高 词 首 词素 位 置 概 
率 、 低 词尾 词素 位 置 概 率 ; (3) 低 词 首 词素 位 置 概率 、 
高 词尾 词素 位 置 概率 ; (4) 低 词 首 词素 位 置 概率 、 低 
词尾 词素 位 置 概率 。 控 制 每 一 种 条 件 下 双 字 词 的 词 
首 笔画 数 与 词尾 笔画 数 、 词 首 字 频 与 词尾 字 频 的 差 
异 不 显著 (((62) < 1, p > 0.05)。 控制 4 种 条 件 下 双 字 
词 的 词 频 差异 不 显著 (F(3, 124) = 0.75, p = 0.52), iii] 
首 笔画 数 差异 不 显著 (F(3, 124) = 0.83, p = 0.47), iii] 
尾 笔画 数 差异 不 显著 (F(3, 124) = 0.94, p = 0.42)、 词 
首 字 频 (F(3, 124) = 0.92, p = 0.43) 和 词尾 字 频 (F(3， 
124) = 1.88, p = 0.10) 的 差异 不 显著 。 考 虑 到 词素 结 
构 可 能 对 词汇 认 知 加 工 造成 影响 ,材料 选取 时 尽 可 
能 避免 选取 偏 正 复合 词 和 含有 词缀 的 双 字 词 .同时 ， 
控制 4 种 条 件 词 首 和 词尾 的 构 词 能 力 之 间 差 异 不 显 
著 , ts < 1, ps > 0.05。 此 外 , 请 15 名 不 参加 实验 的 
同学 对 目标 词 的 熟悉 度 和 语义 透明 度 进 行 评 定 ， 其 
中 1 代表 “非常 不 熟悉 ”，5 代表 “非常 熟悉 ”1-5 的 
变化 代表 词语 熟悉 性 的 增强 ,目标 词 的 熟悉 度 为 M = 
4.06 (SD = 0.19); 语义 透明 度 指 的 是 复合 词 的 语义 
能 从 其 各 个 组 成 词素 的 语 义 推 知 的 程度 。 其 中 1 
代表 “完全 不 透明 词 ”",5 代表 “完全 透明 词 ”，1~5 的 
变化 代表 语义 透明 度 的 增强 ， 目 标 词 的 语义 透明 度 
为 M=4.15 (SD = 0.11)。 其 中 ， 目 标 词 的 词 频 显 著 
低 于 实验 2a 中 目标 词 的 词 频 (! = —10.49, p < 
0.001)。 实 验 材 料 的 基本 情况 见 表 16。 
依据 目标 词 编制 句子 , 目标 词 出 现在 句子 的 中 


N 


概率 在 句子 阅读 中 的 作用 


51 实验 目的 和 假设 
通过 操纵 词 首 和 词尾 的 词素 位 置 概率 的 高 低 ， 
考察 在 低频 词 条 件 下 词素 位 置 概率 线索 是 否 会 影 


间 位 置 ， 句子 长 度 在 18~20 个 汉字 之 间 。 选 取 15 
名 不 参加 正式 实验 的 大 学 生 对 句子 的 通顺 性 进行 5 
级 评定 ， 从 1“ 非 常 不 通顺 ”到 5“ 非常 通顺 ”, 平均 通 
顺 性 为 M = 4.01 (SD = 0.32)。 选 取 15 名 不 参加 正 
式 实 验 的 大 学 生 对 句子 的 难度 进行 5 级 评定 ， 从 
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表 16 实验 材料 基本 情况 
词素 位 置 词 首 词素 词尾 词素 整 词 词 词尾 词 首 词尾 
概率 类 型 位 置 概率 位 置 概率 词 频 笔画 数 笔画 数 E E 
高 词 首 -高 词尾  0.82(0.08) 0.80 (0.08) | 2.17 (2.27) | 9.56(1.50) 9.53 (2.57)  180.74(174.92) 167.83 (181.91) 
高 词 首 - 低 词 尾 。 0.82(0.00 ^ 0.22(0.07 1.78 (2.13) 9.03 (2.76) 9.65 (2.92)  122.10(161.87) ^ 101.44 (74.51 ) 
低 词 首 - 高 词尾 0.21 (0.06) . 0.81 (0.09) 2.37 (3.12) 9.25 (2.15) — 8.84(2.68) 177.50 (150.80) 202.61 (190.59 ) 
低 词 首 - 低 词尾 0.25 (0.06) 0.26 (0.06) 1.57 (1.74) 8.68 (2.49) 9.96 (2.83) 154.64 (147.35) 194.69 (229.69 ) 


1“ 非 常 简单 ”到 5“ 非常 难 ”, 平均 难度 为 M = 1.89 
(SD = 0.21)。 考 虑 到 词素 结构 可 能 对 词汇 认 知 加 工 
造成 影响 , 保证 实验 选取 的 词汇 材料 词素 与 整 词语 
义 关联 程度 相同 ,并 避免 选取 偏 正 复合 词 和 含有 词 
Bin) Ab, 选取 15 名 不 参加 正式 实验 的 大 
学 生 对 句子 的 预测 性 进行 评定 。 预 测 性 评定 采用 补 
充 句 子 的 方式 ， 即 将 实验 句 中 目标 词 及 以 后 的 内 容 
删除 ,让 被 试 依据 所 剩 的 部 分 将 句子 补充 完整 。 如 
果 被 试 所 填 内 容 与 目标 词 一 致 ， 则 表明 预测 成 功 ， 
计 1 分 ; 否则 表明 预测 失败 , 计 0 分 。 经 计算 , 句 
子 的 平均 预测 性 为 : M = 0.009 (SD = 0.38), wH H 
标 词 的 可 预测 性 非常 低 。 为 了 避免 被 试 对 实验 句 形 
成 反应 定 势 , 在 阅读 材料 中 随机 插入 填充 句 。 采 用 
拉丁 方 平 衡 设 计 将 实验 材料 分 为 4 个 Block， 每 一 
个 Block 包含 4 个 练习 句 、32 PSEA 32 个 填 
充 句 。 实 验 材料 举例 如 表 17。 


表 17 实验 材料 举例 


5.2.6 “分析 指标 

同 实验 2a。 

所 有 被 试 正确 率 均 在 85% 以 上 (SD = 5.9%), 说 
明 被 试 都 认真 阅读 了 实验 材料 并 且 理 解 了 句子 的 
内 容 。 参考 以 往 人 研究 的 数据 删除 标准 (Rayner, 2009) 
对 眼 动 数据 进行 整理 : (1) 删 除 注视 点 持续 时 间 小 于 
80 ms 或 大 于 1200 ms 的 注视 点 (2.1%)。(2) 删 除 单 
个 句子 上 的 注视 点 总 数 少 于 5 个 的 试 次 或 者 追踪 丢 
失 的 数据 (0.68%)。 眼 动 数 据 基 于 R 语言 环境 (R 
Development Core Team，2016) 下 的 线性 混合 模型 
(Linear Mixed-effects Models, LMMs) 和 Ime4 数据 
包 进 行 统计 (Bates et al., 2017)。 数 据 分 析 时 对 注视 
时 间 指 标的 数据 进行 了 log 转换 , 将 词 首 与 词尾 词 
素 位 置 概率 以 及 它们 之 间 的 交互 作用 作为 固定 效 
应 纳入 模型 ,对 于 因 变 量 指标 , 模型 的 建立 以 被 试 
和 项 目 作为 交叉 随机 效应 。 应 用 马尔 可 夫 链 蒙特 卡 
罗 (Markov-Chain Monte Carlo) 的 算法 得 出 事后 分 


S.3 


词素 位 置 概率 类 型 ”目标 词 例句 
高 词 首 -高 词尾 。 钢丝 这 堂 课 匡 老师 重点 讲解 布 的 模型 参数 来 作为 显著 性 的 估计 值 ， 这 一 统计 算 
钢丝 的 实际 用 处 。 法 的 优势 是 可 以 同时 反映 来 自 被 试 和 项 目的 变异 
ae X EM n (Baayen et al., 2008)。 模 型 拟 合 时 首先 从 最 大 效应 
低 词 首 -高 词尾 — 票据 me z 模型 开始 ， 耕 复 杂 模 型 无 法 拟 合 则 依次 简化 最 大 模 
票据 的 实际 用 处 。 型 直至 模型 能 够 拟 合 。 不 同 条 件 下 眼 动 指标 的 描述 
低 词 首 - 低 词尾 。 妇联 这 堂 课 吴 老师 重点 讲解 性 统计 结果 见 表 18, 线性 混合 模型 统计 结果 见 表 19。 
E Lube ud 根据 线性 混合 模型 的 统计 结果 , 词 首 词素 位 置 
BOUE imde Sco ddr 概率 在 凝视 时 间 (t= 2.01, p = 0.05), 、 回 视 路 径 时 间 
5.2.4 ”实验 仪器 (1=2.65, p= 0.01)、 总 注视 时 间 (1= 3.03, p = 0.004) 
同 实验 2a。 上 的 主 效应 显著 。 词尾 词素 位 置 概率 在 首次 注视 时 
5.2.5 ”实验 程序 间 (t = —0.39, p = 0.69), BEMLINTHI(¢ = -0.60, p = 
同 实验 2a. 0.55)、 回 视 路 径 时 间 (t = 0.00, p = 0.99)、 总 注视 时 
表 18 不 同 词素 位 置 概率 条 件 下 眼 动 指标 的 描述 统计 结果 

高 词 首 -高 词尾 264 (101) 347 (223) 432 (301) 478 (333) 

高 词 首 - 低 词尾 270 (106) 356 (222) 431 (294) 484 (339) 

低 词 首 -高 词尾 278 (100) 381 (231) 468 (331) 528 (341) 

低 词 首 - 低 词 尾 271 (104) 357 (219) 478 (357) 508 (365) 


AV 人 (人 三 
| | I 人 人 L| V I 
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表 19 不 同 词素 位 置 概率 条 件 下 线性 混合 模型 的 统计 结果 
分 析 指 标 效应 b SE t 95% CI 
词 首 词素 位 置 概率 0.03 0.02 1.65 [0.00, 0.06] 
首次 注视 时 间 词尾 词素 位 置 概率 —0.01 0.02 —0.39 —0.04, 0.03] 
词 首 x 词 尾 词素 位 置 概率 —0.06 0.04 -1.57 —0.12, 0.01] 
词 首 词素 位 置 概率 0.05 0.02 2.01* [0.00, 0.10] 
凝视 时 间 词尾 词素 位 置 概率 —0.02 0.03 —0.60 —0.08, 0.04] 
词 首 x 词 尾 词素 位 置 概率 -0.11 0.05 -2.8' —0.21, —0.01] 
词 首 词素 位 置 概率 0.08 0.03 2.65* [0.02, 0.13] 
回 视 路 径 时 间 词尾 词素 位 置 概率 0.00 0.03 0.00 [-0.06, 0.06] 
词 首 x 词 尾 词素 位 置 概率 —0.02 0.07 —0.29 —0.17, 0.12] 
词 首 词素 位 置 概率 0.08 0.03 3.03** [0.03, 0.13] 
总 注视 时 间 词尾 词素 位 置 概率 —0.02 0.03 —0.49 —0.08, 0.05] 
词 首 x 词 尾 词素 位 置 概率 一 0.08 0.08 -1.10 —0.23, 0.07] 


间 (1= —0.49, p = 0.63) 上 的 主 效 应 均 不 显著 。 词 首 与 
词尾 词素 位 置 概率 交互 作用 在 凝视 时 间 上 显著 (1 
-2.18, p = 0.03), 在 首次 注视 时 间 (t = -1.57, p = 
0.12)、 回 视 路 径 时 间 (t = -0.29, p = 0.77)、 总 注视 
时 间 (t= 一 1.10,p = 0.28) 上 的 交互 作用 均 不 显著 。 

针对 词 首 与 词尾 词素 位 置 概率 在 首次 注视 时 
间 、 回 视 路 径 时 间 、 总 注视 时 间 上 均 不 存在 交互 效 
Dy, 通过 贝 叶 斯 因子 (Bayes Factor) 进 一 步 检验 首 、 
尾 词素 位 置 概率 交互 作用 不 显著 的 可 靠 性 。 应 用 
Bayes Factor 数据 处 理 包 , 分 别 对 首次 注视 时 间 、 


词汇 加 工 的 整个 过 程 。 大量 实 证 研究 肯定 了 词 首 的 
加 工 优势 ， 拼 音 文字 的 研究 指出 词 首 字母 与 高 级 认 
知 功 能 高 相关 , 尾 字母 与 低 水 平 的 视 知 觉 有 关 (Johnson 
& Eisler, 2012), White 等 人 (2008) 通 过 变换 词 首 与 
词尾 字母 的 位 置 区 分 首 、 尾 字母 之 于 词汇 识别 的 重 
要 性 ,发现 变 换 词 首 字母 的 注视 时 间 显 著 高 于 词尾 
变换 ， 词 首 字 母 在 词汇 识别 中 发 挥 了 关键 作用 。 相 
关中 文 研 究 认为 词 首 字 频 在 一 定 程 度 上 调节 尾 字 
信息 的 获得 和 加 工 (Yan et al., 2006)。 吴 琼 (2013) 通 
过 对 目标 词 设置 4 种 条 件 ( 原 词 、 换 位 、 首 字 掩 项 、 


回 视 路 径 时 间 、 总 注视 时 间 进 行 线 性 混合 模型 的 贝 
叶 斯 分 析 (Morey et al., 2018)。 分 析 将 既 包含 两 因素 
主 效应 也 包含 两 因素 交互 作用 的 全 模型 (BFrn)， 与 
包含 两 因素 的 主 效应 模型 (BFyi,) 相 比较 , 即 BF = 
BFrun/ BF uaino £ BF 值 小 于 1， 表示 支持 虚无 假设 ， 
即 两 因素 交互 作用 不 显著 ; a BF 值 大 于 1， 则 支持 
备 择 假设 ， 即 两 因素 交互 作用 显著 存在 。 在 分 析 过 
程 中 , 选取 默认 的 先 验 概率 值 0.5, 设 定 蒙 特 卡 罗 
迭代 次 数 (Monte Carlo iterations) 为 100000, 贝 叶 斯 
分 析 结 果 显 示 所 有 指标 BF 值 均 小 于 1 (首次 注视 时 
间 : 1: 3.03; 回 视 路 径 时 间 : 1 : 6.41; 总 注视 时 间 : 
1:11.56), 分 析 结 果 更 加 支持 词 首 与 词尾 词素 位 置 
概率 之 间 不 存在 交互 作用 。 
5.4 讨论 

实验 2b 结果 表明 ,与 词尾 词素 位 置 概率 相 比 ， 
词 首 词素 位 置 概率 对 词汇 识别 与 切 分 占 首要 地 位 。 
在 反映 词汇 早期 加 工 指标 的 凝视 时 间 上 , 词 首 词素 
位 置 概率 主 效应 显著 ; 在 反映 词汇 后 期 语义 整合 的 
眼 动 指标 回 视 路 径 时 间 、 总 注视 时 间 上 主 效应 亦 显 
著 , 这 意味 着 词 首 词素 位 置 概率 的 作用 近乎 贯穿 了 


Ei 


ETHE, WAE”. A "Ug". "SHIPS: 
察 词素 位 置信 息 的 重要 性 , 研究 发 现 当 双 字 词 词 首 
被 掩蔽 时 (如 “ 虽 力 ”) 加 工 难度 最 大 ， 进 一 步 印 证 词 
首 在 词汇 加 工 过 程 中 的 重要 性 。 

此 外 ， 自 我 组 织 词 汇 习 得 与 识别 模型 (self- 
organizing lexical acquisition and recognition, SOLAR) 
Hih, PEHME A CG ER BE P T8] RS Ae 0 91285 4] i 
WRAY, 词 首 字母 获得 了 加 工 优 势 (Davis，2001)。 
Whitney (2001) 提 出 的 SERIOL (sequential encoding 
regulated by inputs to oscillations within letter units) 
模型 也 指出 ,字母 的 兴奋 性 输出 在 整 词 上 呈 梯 度 变 
化 ,变化 方向 是 从 词 首 向 词尾 逐渐 减弱 。Zhou 和 
Marslen-Wilson (1999) 认 为 首 词素 的 加 工会 激活 整 
词 的 语义 表征 ， 继 而 影响 尾 词 素 识别 。 综 上 , 词 首 
词素 位 置 在 词汇 识别 与 加 工 过 程 中 具有 一 定 优势 。 
依据 汉语 阅读 的 词 切 分 和 识别 模式 (Li et al., 2009), 
知觉 广度 范围 内 的 字 均 被 激活 , 字 所 携带 的 位 置信 
息 亦 被 激活 。 当 词 首 词素 位 置 概率 较 高 时 ， 词 首 携 
带 的 词素 位 置 概率 信息 容易 被 激活 ， 例如“ 钢 " 字 位 
于 词 首 的 词素 位 置 概率 为 0.87, 那么 “ 钢 ” 居 于 词 首 
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的 信息 被 预先 激活 ， 当 阅读 “钢丝 ”一 词 时 , 被 试 发 
现 当前 汉字 的 实际 位 置 与 惯常 位 置 相 契 合 ， 于 是 词 
汇 加 工 较 快 , 反之 亦 然 。 


6 综合 讨论 


本 研究 通过 词汇 判断 和 有 眼 动 实验 , 探讨 了 词素 
位 置 概率 信息 与 中 文 词汇 识别 与 切 分 之 间 的 关系 。 
综合 分 析 4 个 实验 发 现 词素 位 置 概率 能 有 效 引 导读 
者 的 阅读 行为 ， 且 作用 发 挥 受 整 词 词 频 影响 ， 读 者 
在 低频 双 字 词 识 别 中 更 依赖 词素 位 置 概率 信息 。 值 
得 一 提 的 是 ,研究 结果 显示 词 首 词素 位 置 概率 的 影 
响 其 于 词尾 词素 位 置 概率 ， 且 有 眼 动 实验 发 现 词 素 位 
置 概率 效应 持续 发 生 在 词汇 加 工 的 早 、 晚 期 阶段 。 
在 单词 独立 识别 及 句子 语 境 中 均 发 现 了 较为 稳健 
的 词素 位 置 概率 效应 ,下面 分 别 讨论 词素 位 置 概率 
在 中 文 词汇 识别 与 切 分 中 的 作用 及 影响 因素 。 
6.1 词素 位 置 概率 在 中 文 词汇 识别 与 切 分 中 的 

作用 

本 研究 发 现 词素 位 置 概率 能 够 促进 词汇 的 识 
别 与 切 分 , 词素 位 置 概率 越 高 注视 时 间 越 短 ， 且 简 
单线 性 回归 模型 说 明了 这 一 注视 事件 的 规律 。 这 与 
连 坤 予 等 人 (2021) 的 研究 结果 具有 较 强 一 致 性 。 基 
于 Li 和 Pollatsek (2020) 提 出 的 中 文 阅读 整合 模型 ， 
知觉 广度 范围 内 的 汉字 被 平行 激活 , 汉字 所 组 成 的 
词 相 应 被 激活 。 当 注视 目标 词 时 , 目标 词 的 汉字 被 
激活 ， 字 所 携带 的 位 置信 息 亦 被 激活 ,词素 位 置信 
息 的 激活 强度 与 其 所 处 位 置 的 使 用 频率 关系 密切 。 
换言之 ， 某 一 词素 位 置 的 使 用 频率 越 高 ， 词 素 被 激 
活 的 水 平 越 高 。 在 中 文 词汇 的 学 习 和 使 用 过 程 中 读 
者 的 阅读 经 验 不 断 增 加 ， 逐渐 意识 到 一 些 字 常 出 现 
在 词 首 , 而 男 一 些 字 常 居于 词尾 ,词素 与 词素 位 置 
的 联系 得 到 强化 。 鉴 于 此 ， 若 词素 实际 位 置 与 预期 
位 置 相 符 , 词 切 分 较 容易 ; 若 词素 实际 位 置 与 预期 
位 置 不 符 ， 需 启动 词素 位 置 的 再 分 析 ， 对 词素 出 现 
的 实际 位 置 与 惯常 位 置 进 行 核 证 ,为 解决 这 一 位 置 
冲突 ,读者 不 得 不 对 有 限 的 认 知 资源 进行 二 次 分 配 ， 
致使 注视 时 间 增 多 。 同 时 , 依据 激活 扩散 模型 
(Collins & Loftus，1975) 和 交互 激活 模型 (McClelland 
& Rumelhart，1981)， 中 文 词汇 识别 是 一 个 交互 激 
活 的 过 程 , 字 特征 信息 的 激活 前 馈 到 词 水 平 激 活 相 
应 词 单元 。 词 的 激活 反馈 到 组 成 该 词 的 字 水 平 , 组 
成 优势 词 的 字 的 识别 更 快 。 当 加 工 双 字 词 的 首 字 时 ， 
其 所 携带 的 高 词素 位 置 概率 信息 被 激活 ， 以 该 字 开 
头 的 候选 双 字 词 更 易 激 活 ， 被 激发 的 候选 双 字 词 反 


过 来 促进 词 首 位 置 的 识别 ,词素 位 置 的 使 用 频率 越 
高 激活 越 快 ， 最 终 使 词汇 识别 速度 加 快 。 

需 关注 的 是 ， 当 前 研究 发 现 词 首 词素 位 置 概率 
的 作用 更 为 关键 ， 且 观察 到 首 、 尾 词素 位 置 概率 的 
交互 作用 不 显著 ,这 说 明 词 首 词素 位 置 概率 对 词汇 
识别 的 促进 作用 具有 独立 性 , 不 受 词尾 词素 位 置 概 
率 影 响 。 大 量 实证 研究 支持 了 词 首 位 置 的 重要 性 ， 
Taft(2004) 认 为 在 双 词 素 词 通达 过 程 中 , 首 词素 是 
主要 搜索 对 象 ， 尾 词素 的 作用 相对 较 小 。 词 汇 开始 
部 分 所 携带 的 信息 量 ( 如 语义 或 词 频 ) 要 大 于 结尾 部 
分 的 信息 量 (Shillcock et al., 2000)。 字 母 换 位 效应 的 
研究 认为 含有 字母 换 位 单词 的 句子 会 造成 读者 认 
知 资源 的 额外 损耗 ， 其 损耗 程度 与 单词 字母 的 换 位 
位 置 相关 ,， 换 位 发 生 在 单词 开头 时 认 知 资源 损耗 最 
K, 词尾 次 之 Perea & Lupker, 2003)。 注 意 资 源 的 
分 配 受 字 复 杂 性 的 影响 ,这 种 影响 显著 体现 在 复合 
词 的 词 首 位 置 ， 词 尾 则 没有 (Ma & Li, 2015). Davis 
(2001) 提 出 的 自我 组 织 词汇 习 得 与 识别 模型 指出 ， 
每 个 字母 的 识别 与 自身 的 激活 水 平 有 关 , 首 字母 激 
活水 平 最 高 ， 随 后 激活 水 平 递减 ， 最 后 一 个 字母 激 
活水 平 最 低 。 

来 自 汉 语 表 意 文字 的 研究 也 印证 了 首 词素 的 
激活 优势 ， 徐 偿 嘉 和 降雪 (2018) 发 现 目标 词 的 首 字 
身份 信息 一 旦 破坏 , 词汇 的 注视 时 间 将 显著 增加 。 
陈曦 等 人 (2006) 采 用 语义 启动 和 色 词 干扰 范式 发 现 ， 
首 词素 在 三 种 不 同 的 刺激 间隔 条 件 下 激活 都 达到 
较 高 水 平 。 同 时 , 结合 Inhoff 和 Wu (2005) 提 出 的 
中 文 词汇 识别 的 单 向 切 分 假设 (un-directional 
parsing hypothesis), 汉语 是 从 左 至 右 逐 词 展开 的 ， 
词 切 分 遵循 着 从 左 向 右 的 序列 , 受 注意 梯度 的 影响 
左 侧 汉 字 得 到 的 注意 资源 较 多 ， 且 资源 从 左 至 右 传 
递 ,， 左 侧 汉 字 的 激活 早 于 右 侧 汉字 ,， 词 首 信息 激活 
的 同时 词素 携带 的 位 置信 息 亦 被 激活 。 若 词素 在 词 
首位 置 的 使 用 频次 较 高 时 ， 对 词素 位 置 的 敏感 性 提 
升 ， 当 词 首 词素 的 实际 位 置 与 固有 位 置 契 合 时 ， 高 
词 首 词素 位 置 概率 向 整 词 释放 兴奋 ,加快 了 词汇 的 
识别 速度 。 

6.2，” 词 频 对 词素 位 置 概率 发 挥 词 切 分 作用 的 影响 

本 研究 发 现 词 频 调节 了 词素 位 置 概率 对 词汇 
识别 与 切 分 的 影响 ， 当 目标 词 为 高 频 时 , 词 首 词 素 
位 置 概 率 对 阅读 行为 的 影响 较 弱 ， 而 加 工 低 频 词 时 
词 首 词素 位 置 概率 发 挥 了 显著 作用 。 有 研究 指出 低 
频 词 在 识别 过 程 中 存在 词素 的 语义 激活 ， 而 高 频 词 
词素 的 语义 激活 不 明显 ,低频 词 更 易 被 分 解 表 征 ， 
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高 频 词 则 倾向 于 整 词 表征 ( 命 林 先 , 2006)。 既 往 研 究 
指出 不 同 词 频 条 件 下 读者 耗费 的 心理 资源 不 同 , 低 
频 词 的 加 工 负荷 高 于 高 频 词 (高 晓 雷 等 , 2020; Rayner, 
2009; Vorstius et al.，2014)， 即 当中 文 读者 在 句子 
阅读 过 程 中 唱 遇 低频 词 时 , 需要 投入 更 多 的 认 知 资 
源 来 加 工 低频 词汇 ， 而 词素 特征 在 低频 词 条 件 下 更 
易 显 现 ( 白 学 军 等 , 2015; Liversedge et al., 2014), 
此 时 固有 的 词素 位 置 概率 信息 为 读者 提供 了 隐 含 
的 词 边界 。 当 目标 词 转 为 高 频 条 件 时 , 由 于 人 们 和 党 
能 听 到 、 见 到 或 书写 高 频 词 ， 刺 激 材料 的 加 工 难 度 
降低 , 倾向 以 整 词 形 式 表征 ， 导致 激 活水 平 较 高 ， 
在 来 自 词素 水 平 的 前 馈 激活 到 来 之 前 很 可 能 已 经 
被 识别 了 , 因此 使 读者 不 能 充分 提取 词素 位 置 概率 
的 特征 信息 ， 这 在 很 大 程度 上 弱化 了 词素 位 置 冲突 
的 潜在 干扰 ， 继而 掩盖 了 词素 位 置 概率 的 作用 。 
Chu 和 Leung (2005) 的 研究 指出 高 频 词 倾向 自 上 而 
下 的 整体 加 工 , 重视 整体 时 局 部 的 特征 易 忽 略 ， 此 
时 难以 析出 词素 ， 而 低频 词 更 倾向 自 下 而 上 的 局 部 
加 工 , 使 届 部 的 词素 位 置 概率 特征 得 到 关注 。 

结合 以 往 研 究 ， 词 频 在 复合 词 表 征 中 扮演 了 重 
要 角色 。 我 们 都 明白 “海象 "、“ 海 马 ”" 这 类 词语 表达 
的 意义 ， 读 到 这 些 词 时 可 能 头脑 中 还 会 闪现 其 视觉 
形象 ,然而 我 们 不 会 把 这 些 形象 分 解 为 海中 的 象 、 
海中 的 马 ,， 可见 一 定 存 在 与 其 相对 应 的 整体 单元 。 
相对 而 言 ， 如 果 看 到 * 海 免 ”" 这 个 词 ,由 于 很 少 遇 到 
“ 海 兔 ”一 词 ， 心理 词典 中 不 大 可 能 存在 它 的 独立 表 
征 单元 ,， 整 词 通达 受阻 ,那么 就 要 通过 词素 通达 。 
依据 复合 词 的 混合 通达 表征 模型 ,心理 词典 中 既 存 
在 词素 表征 ， 也 存在 整 词 表征 ,词汇 识别 是 词素 激 
活 和 整 词 激活 相互 作用 的 结果 。 低 频 词 在 日 常 阅读 
中 不 常见 ， 以 词素 形式 存 于 心理 词典 ， 且 深 受 词素 
特征 影响 ,使 得 词素 位 置 概率 的 特征 信息 得 以 表 
征 。 在 低频 词 的 加 工 中 激活 了 词素 位 置 概率 线索 ， 
助力 词汇 的 识别 与 切 分 。 反 观 高 频 词 ， 日 常 阅 读 中 
出 现 的 频率 较 高 ,激活 阔 限 较 低 ， 通 过 整 词 的 形式 
存储 在 心理 词典 中 ,对 词素 特征 信息 不 够 敏感 ， 词 
素 位 置 概率 信息 作用 有 限 。 

综合 地 看 ,词素 位 置 概率 在 中 文 动态 的 词 切 分 
过 程 中 发 挥 了 作用 , 反映 出 汉语 读者 在 长 期 接触 汉 
字 位 置信 息 过 程 中 所 形成 的 心理 倾向 。 而 这 种 词素 
位 置 的 识别 能 力 是 否 具 有 发 展 性 ,还 需 后 续 人 研究 进 
一 步 揭 示 ， 比 如 探查 发 展 中 的 儿童 、 语 言 发 展 受 阻 
的 阅读 障碍 儿童 ， 以 及 阅读 经 验 相 对 丰富 的 老年 人 
对 词素 位 置 概率 的 运用 或 保留 情况 。 综 上 ,读者 在 


阅读 过 程 中 抽取 了 词素 位 置 概率 这 项 特征 ， 这 也 意 
味 着 词素 作为 一 个 独立 的 语言 单元 得 到 了 加 工 , 说 
明 中 文 复合 词 加 工 过 程 中 存在 词素 通达 。 而 目标 词 
转 为 高 频 词 后 词素 位 置 概率 的 特性 表现 的 不 明显 ， 
说 明 复合 词 加 工 过 程 中 也 存在 整 词 通达 ,综合 而 言 ， 
研究 结果 支持 了 中 文 复合 词 加 工 的 混合 通达 表征 
模型 。 


7 结论 


中 文 阅读 中 词素 位 置 概率 信息 是 读者 重要 的 
语言 词 切 分 线索 ,， 且 与 词尾 词素 位 置 概率 相 比 , 词 
首 词素 位 置 概率 在 词汇 识别 与 切 分 过 程 中 发 挥 的 
作用 更 大 。 同 时 , 读者 对 词素 位 置 概率 信息 的 加 工 
优势 受 整 词 词 频 的 影响 , 研究 结果 支持 复合 词 识 别 
加 工 的 混合 通达 表征 模型 。 
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Abstract 

Understanding the cognitive mechanisms underlying word segmentation has been an important focus for 
research on Chinese reading. Previous research shows that Chinese readers can identify words very efficiently 
even though the Chinese script does not use spaces between words or other visual cues to demarcate word 
boundaries. One possibility is that Chinese readers can make use of their knowledge of the positional frequency 
of characters (1.e., how often they are used as the first or second character in words) to facilitate the word 
segmentation and recognition. Nevertheless, this potential role for position frequency remains controversial. 
Accordingly, with the present research we used the lexical decision task and eye movements during reading to 
investigate the use of positional frequency information about the first and second character of two-character 
words in both visual word recognition and reading. 

Four experiments were conducted to explore the effects of character positional frequency. In Experiments 
la and 1b, we manipulated both first and second character positional frequency (high vs. low) for target words 
that were of either high or low lexical frequency. Sixty college students were instructed to perform visual lexical 
decision tasks on words and pseudo-words. In Experiment 2a and 2b, we used measures of eye movements to 
investigate the use of character positional frequency in natural sentence reading. Sixty college students were 
required to read sentences while their eye movements were recorded using an EyeLink 1000 eye-tracker 
(sampling rate — 1000 Hz). 

The results of Experiments 1a and 1b revealed an effect of first character positional frequency in both the 
accuracy and latency of lexical decisions only for target words with low lexical frequency, and no effect of 
second character positional frequency regardless of the lexical frequency of the target word. The results of 
Experiment 2a and 2b showed a clear effect of first character position frequency on reading times (gaze duration, 
regression path reading time, and total reading time) for target words of low lexical frequency only, and no 
effect of second character positional frequency for either high or low frequency target words. Participants made 
shorter response times and fixation duration in high character positional frequency condition than in low 
character positional frequency condition for target words with low lexical frequency. 

In sum, findings from both the lexical decision task and measures of eye movements in reading reveal a 
privileged role for first character positional frequency as a cue to word segmentation and recognition. However, 
this influence of character positional frequency depends on word frequency, and is only observed for words of 
lower lexical frequency. We argue that these findings support the augmented addressed morphology model 
theory of Chinese word recognition, and can help inform the development of a model of character positional 
processing model in Chinese reading. 

Keywords word segmentation, character positional frequency, Chinese reading, eye movements 


